Оптимизация и продвижение сайтов в поисковых системах: Яндекс метрика
Сегодня в Интернете все измеряется точными цифрами. При необходимости на собственном интернет-сайте, можно узнать сколько пользователей на него заходит, какие странички посещают, как долго читают или смотрят на страницу или что конкретно делают, что, конечно, становится источником бесконечных улучшений для оптимизаторов и продвижения сайтов в поисковых системах. Таким образом выявляют предпочтения существующей аудитории: получают информацию о возрасте и круге интересов пользователей, эти сведения - ключевой фактор развития интернет-ресурса, делать сайт понятнее и удобнее для потенциальных покупателей.
Аналитические системы
Отслеживать то, насколько удачно посещается интернет-сайт, подвергать оценке качество оптимизации и продвижения в поисковых системах помогают аналитические веб-системы. Отличаются комплектацией и широтой возможностей, скоростными параметрами обработки информации и интерфейсом. Хоть и главным образом они сконструированы схожим образом, по стандарту, сервисы аналитики состоят из 3х разделов. Первое, это счетчик. На интернет-ресурсе помещается код и всякий раз, во время загрузки странички посетителем или если посетитель совершает на ней определенные действия, счетчик направляет сообщение в базу сбора сообщений, что в статистическом масштабе позволяет делать выводы и осознанно оптимизировать и продвигать сайты в поисковых системах. Это второй раздел сервиса, там сведения подвергаются систематизации и обработке. Третий раздел - интерфейс, где указаны обработанные сведения по тому или другому интернет-сайту и отчетные данные на их основе - в таблицах и графических изображениях.
У Яндекса существует собственная система аналитики, которую ежедневно используют собственники интернет-сайтов. Называется она Метрика. Она может стремительно подвергать обработке объёмные сведения и выстраивать отчеты в режиме онлайн.
Метрика, как и каждая аналитическая веб-система, оперирует рядом определений. «Посетитель» - это человек, который зашел на интернет-сайт. Если он посещает сайт в первый раз, то в онлайн-браузер заносится уникальный идентификатор, системный счетчик которого опознаётся при следующем заходе, чтобы отделять новых посетителей от тех, кто уже бывал. «Просмотр» - разовое обращение пользователя к интернет-сайту, в том числе обновляет страничку. «Визит» - рабочий сеанс посетителя на интернет-сайте. Началом посещения считается момент, когда пользователь загружает в браузер интернет-сайт, и окончанием, если пользователь ничего не делает конкретное время - стандартно, это продолжается тридцать минут. Период посещение содержит в себе просмотры страниц сайта. В базе Яндекса сохраняются сведения о конкретных просмотрах, так и об отдельных посещениях. Качественная оптимизация и продвижение сайтов в поисковых системах сегодня невозможно без метрики.
Сбор информации
Когда пользователь переходит на интернет-сайт со счетчиком Яндекса - из поисковика, соц.сети, с вывески рекламы или после ввода параметров в адресной строчке, - браузер загружает код странички. В это время счетчик направляет в Метрику следующие сведения: факт загрузки странички, идентификатор пользователя, адрес странички, с которой он зашел, наименование и данные онлайн-браузера и ОС и т.д. Метрике ничего неизвестно о посетителе и нет никаких данных о совершённых в Интернете действиях. Идентификатор пользователя и другие параметры делаются частью обезличенной статистической информации - цифрами, которые используются для развития интернет-сайта.
Пока пользователь пребывает на интернет-сайте, счетчик собирает статистические данные и отправляет в Метрику. Когда посетитель открывает конкретную страничку, счетчик регистрирует этот просмотр. Чтобы посещение влияло на оптимизацию и продвижение сайта в поисковых системах, он должен продолжаться дольше пятнадцати секунд, и в Метрику вновь приходит сообщение, что пользователь продолжает просматривать страницу. Если же посетитель перешел исключительно на одну страничку интернет-сайта и был там менее пятнадцати секунд, то счетчик направляет сообщение об "отказе". Процентное соотношение "отказов" к полноценным визитам, помогает собственнику интернет-сайта получить аналитически важные сведения: сколько пользователей не заинтересовало содержимое странички; сколько попали случайным образом на сайт и т.д. Все эти показатели напрямую влияют на оптимизацию и продвижение сайтов в поисковых системах.
С помощью счетчика фиксируется прокручивание странички, движения мышки компьютера и клики по кнопочкам и интернет-ссылкам (отчет о таких действиях собственник интернет-сайта может рассмотреть в специальном разделе Яндекс Метрики, который называется Вебвизор). Заодно он показывает, совершил ли пользователь важные для собственника интернет-сайта действия.
Формирование отчетов происходит моментально. Владельцу ресурса достаточно просто обозначить, что ему сейчас требуется для просмотра – сразу же происходит извлечение сведений из базы, на мониторе отображается полученная информация. При этом можно увидеть всех, кто посещал сайт, в том числе – в последние минуты.
Вопрос хранения и обработки информации
Формирование отчетов выполняется в режиме реального времени. Это позволяет видеть структуру, когда хозяином портала вводится запрос о том, чтобы получить отчет. Это делается с использованием интерфейса Метрики. Важно, что скорость формирования отчета не зависит от структуры – на это уходят секунды.
Для получения свежей и полноценной информации о посещаемости системы или чтобы управлять базами сведений – ClickHouse, непрерывно собирает и выполняет обработку информации о том, сколько человек посетило портал. Сведения, которые представляются в отчетах, готовятся в двух вариантах. Первый, по которому работала Метрика ранее, предполагает предварительный сбор сведений и составление по результату фиксированного списка отчетов. Плюс метода – возможность быстрой загрузки данных, минус – ограничение по гибкости анализа, поскольку пользователю доступен лишь один отчет из всего набора.
Согласно второму варианту возможно сохранение событий, которые поступают, без выполнения их агрегации предварительно. Расчеты при этом делаются в режиме онлайн – в момент загрузки отчета владельцем сайта. Это повышает уровень аналитики, однако предполагает повышенную скорость анализа информации. Сегодня в системе доступно использование двух видов управления базами данных – строками и столбцами. Отличие заключается в том, как сформирована система хранения сведений в физическом плане. По стандарту системы используют строковый подход. Это означает расположение информации в таблицах таким образом, что данные, находящиеся в ячейках одной строчки, «лежат» последовательно.
Эти системы могут использоваться, когда необходимо обрабатывать транзакции, благодаря тому, что в них возможно быстрое обновление отдельных строк базы. Если требуется получить сведения, расположенные в нескольких столбцах, при этом строк задействуется много, такая система работает не столь эффективно. Дело в том, что при такой задаче требуется прочесть и отсеять значения тех столбцов, данные из которых не нужны. А это – дополнительное время. Системы управления базами данных, в число которых входит ClickHouse, предполагают хранение информации в столбцах. То есть цифры, информация, которая входит в один столбец, располагаются рядом. В Яндекс.Метрике предусмотрено хранение событий: визитов, просмотров и других, - в разных таблицах. Строкам в них отводится роль хранилища данных о событиях.
Столбцам – о параметрах этих событий. Это дает возможность расширять число параметров, одновременно сохраняя высокую производительность системы. Так, когда требуется отчетность о том, сколько было уникальных посетителей по разным регионам, можно всего лишь ознакомиться с информацией в двух столбцах. Как свидетельствует статистика, на октябрь 2015-го Метрика сохранила и обработала, лишь по запросам веб-сайтов, более десяти с половиной триллионов строк. Самая масштабная страница включает 349 столбцов.
Система работает таким образом: при открытии хозяином сайта страницы Метрики ClickHouse получает не один запрос, а целую серию. В течение одной секунды в базу приходит около двух тысяч запросов. Это означает, что показатель пиковой скорости, с которой обрабатываются данные, выше двух терабайтов в секунду.
Еще одно преимущество ClickHouse – возможность легкого масштабирования. При этом добавлять новые серверы можно, не перестраивая кластер. Высокая скорость обработки данных достигается за счет того, что для работы с одним запросом привлекается вычислительная мощность всех серверов, которые доступны в данный момент.
К числу преимуществ ClickHouse относят устойчивость к отказам и сбоям. При выходе из строя отельных серверов система не прекращает своей работы. Чтобы это было возможным, происходит копирование данных в дата-центрах, которые распределены на территории действия системы. Благодаря ClickHouse расходы по сохранению и обработке информации существенно снижаются, а оптимизация и продвижение сайтов в поисковых системах становится проще и приятнее.