[МУЗЫКА] В качестве основных инструментов веб-аналитики мы будем рассматривать системы Яндекс.Метрика и Google Analytics. Оба этих сервиса бесплатны и удовлетворяют потребностям большинства бизнесов в Интернете. С их помощью мы можем закрыть третий и четвертый из вышеописанных этапов, то есть сбор данных и отчетность. Разберемся как работают системы аналитики. Работают они на основе языка программирования JavaScript и функционала браузеров Cookie-файлов. JavaScript — это сценарный язык программирования. Чаще всего используется для выполнения интерактивных сценариев на веб-сайтах. JavaScript отвечает за все, что относится к манипуляции страницы и взаимодействия с посетителем. Например, это может быть создание и удаление HTML-элементов, cookie-файлов, вывод сообщений; реакция на действия пользователя: клики на элементы, нажатие клавиш, наведение курсора на элементы, выделение текста и так далее; отправка данных на сервер, например данных, которые вы ввели в форму заявки. Код отслеживания систем аналитики как раз является скриптом, написанным на JavaScript. Для того чтобы система аналитики начала собирать данные, этот скрипт необходимо внедрить на всех страницах вашего сайта. Таким образом выглядит JavaScript код отслеживания Google Analytics. И таким образом — код отслеживания Яндекс.Метрики. Файл cookie — это небольшой фрагмент текста, записанный в браузер сайтом, который вы посетили. Он помогает сайту запомнить информацию о вас, например то, на каком языке вы предпочитаете его просматривать, регистрировались ли вы на сайте ранее и тому подобное. Системы веб-аналитики используют эту технологию для того, чтобы определять пользователя. Ваши cookie записываются в уникальный идентификатор и по нему можно узнать пользователя при повторном посещении. Cookie вы можете увидеть в консоли своего браузера. Как происходит сбор данных? Если упрощать, в момент, когда вы вводите адрес веб-сайта в адресную строку, то ваш браузер выполняет запрос к серверу, на котором расположен веб-сайт. Сервер в ответ на запросы от браузера отдает файлы: HTML, стили, скрипты и изображения. Среди этих файлов есть скрипт отслеживания аналитики, который генерирует запрос к своему серверу, куда передает данные о сайте. Какие данные получает сервис системы аналитики? IP-адрес — с его помощью мы узнаем регион, с которого выходит интернет-посетитель. В самих отчетах систем аналитики IP недоступен в целях сохранения анонимности пользователя. User-агент — это идентификатор браузера пользователя, а также любых других приложений, которые осуществляют доступ к веб-сайтам. С помощью этого параметра мы можем узнавать имя и версию браузера пользователя, операционную систему и в некоторых случаях модель мобильного телефона, разрешения экрана и другое. URL страницы — это адрес страницы, на которой находится пользователь. Referer — это адрес предыдущей страницы, с которой пользователь перешел на текущую. Это один из показателей, по которым определяются источники трафика. Timestamp — это время, когда был совершен запрос. И данные из файлов cookie, какие мы захотим туда прописать. Так выглядит запрос на сервера Google Analytics в консоли вашего браузера. Таким образом осуществляется сбор данных. Данные из этого запроса обрабатываются и ими наполняется база данных систем аналитики, на основе которых в свою очередь формируются отчеты о веб-интерфейсе, с которыми мы уже работаем. Касательно точности данных систем аналитики — точных данных в системах аналитики нет. Не стоит воспринимать систему аналитики как систему статистики. Существующие системы аналитики не дают вам стопроцентно точных данных по причине технических ограничений. Ни одна из систем не даст вам ни точного количества заказов, ни точного количества посетителей, которые были на вашем сайте. Почему так происходит? Есть несколько причин: отключены cookie-файлы, например, как в режиме инкогнито; включены блокировщики рекламы (это расширения для браузера, в которые блокируют рекламные блоки и системы отслеживания, такие как Ghostery, Adblock Plus и так далее; отключен JavaScript или присутствуют JavaScript-ошибки, не позволяющие выполняться коду систем аналитики; много пользователей на одном устройстве, например, одним домашним компьютером пользуется все семейство, системы аналитики определяют их всех как одного пользователя; Много устройств и браузеров на одного пользователя. Например, вы можете прийти на сайт с рабочего компьютера, а покупку будете совершать уже дома. Системы аналитики посчитают вас как двух разных пользователей: одного, который ничего не купил и второго, который совершил покупку, которые пришли с разных источников. Сэмплирование. Некоторые системы, в частности Google Analytics, не обрабатывают все данные на крупных проектах. Они берут малую часть данных из выборки и экстраполируют их на всю остальную выборку. К примеру, у вас было 40 заказов за неделю и из них 30 произошли в первые три дня недели, самые активные дни недели по статистики данного сайта. Analytics может взять данные вот по этим трем дням и растянуть их на оставшуюся неделю и вы увидите цифру в 70 заказов вместо фактических 40. Что в этом случае делать? Смотреть на тренды, а не на абсолютные показатели. Принципы построения отчетов в Яндекс.Метрике и Google Analytics похожи. Для их понимания нужно разобраться в основных понятиях. Рассмотрим уровни организации данных в системах. Это хит (просмотр), сессия (визит или сеанс) и пользователь (посетитель). Хит — это какое-либо единичное взаимодействие пользователя с сайтом, которое вызвало отправку запроса с данными на сервер систем аналитики. Например, это может быть просмотр страницы или событие. Сессия — это совокупность всех действий, хитов посетителя в рамках посещения веб-сайта. Пользователь — это совокупность сессий. Определяется наличием в браузере пользователя cookie с уникальным идентификатором. Важно понимать, что посетителем, по сути, является именно конкретный браузер. В случае, если посетитель чистит cookie-файлы, заходит с другого браузера, переустанавливает браузер или операционную систему, он будет считаться новым. Вот пример того, как структура уровня данных может выглядеть на практике. Сами данные могут быть двух типов: параметры (группировки) и показатели (метрики). Параметры — это атрибут данных, то есть какое-либо качественное значение. Например «город», «источник», «тип устройства» — это все параметры. Показатель — количественное значение, которое рассчитывается на основе параметров. Например «сессии», «отказы», «достижения целей» — это все примеры показателей. В интерфейсе обычно параметры отображены в виде рядов, а показатели в виде колонок. Примеры сочетания типов данных. В интерфейсе Google Analytics мы видим тип устройства (мобильные, десктопные и планшеты) и количество сеансов. В интерфейсе Яндекс.Метрики мы видим город и количество визитов. [МУЗЫКА] [МУЗЫКА]