Google Analytics. Осторожно боты

в 7:51, , рубрики: bots, google analytics, Блог компании ХостТрекер, боты, веб-аналитика, роботы, статистика, метки: , , , ,

Google Analytics. Осторожно боты
Столкнулись с любопытной проблемой. На графике визитов видна интересная «ступенька». Мы обрадовались всплеску посещаемости. Но после анализа, выяснилось, что это боты.

Если погуглить на тему «Google analytics и боты», в основном утверждается что боты не влияют на показания статистики в GA. Посыл такой — аналитика использует JavaScript для отслеживания посетителей. Боты, существа примитивные, JavaScript выполнять не умеют, и аналитикой соответственно не учитываются.

Давайте разберемся в деталях.

Анализ трафика

Заметив необычный всплеск, мы решили локализировать его источник. Оказалось:

  • Трафик был без рефереров;
  • Посетители из Цюриха;
  • От одного ISP.

Такой характер трафика мог быть, если в Цюрихе крупное локальное офлайновое издание написало о нас. В этом были большие сомнения. Мы продолжили «копать» дальше.

До уровня IP адреса GA дойти не позволяет. Пришлось заглянуть в логи вебсервера. Трафик шел с одного IP. По логам, стало ясно что это боты. Запрашивались две страницы. Бот судя по всему был продвинут, выполнял JavaScript на странице, сохранял куки. Делал по несколько визитов для каждой сессии. Маскировался под приличного посетителя.

Честно говоря, мы были удивлены, тем что, аналитика учла этот «мусорный» трафик. Поразмыслив, стало понятно, что фильтровать продвинутых ботов аналитике самостоятельно сложно. Тут вспомнили про функцию аналитики Intelligence Events. Аналитика показывается активность, которая выбивается из общей картины. Там действительно была отдельная запись которая связана с ботом. Нельзя сказать что информация там исчерпывающая, но почву для размышления дает.

Как противодействовать?

Первым делом попытайтесь найти источник трафика и его характеристики. В нашем случае, мы легко вычислили ботов, визиты были с одного IP. Если в работу включится ботнет, даже с несколькими десятками узлов, то определить такой трафик сложнее.

Отфильтровать можно двумя способами:

  1. Если боты вам не мешают, то ставьте фильтр по IP или ISP в GA (Admin -> Account -> AllFilters):

    Google Analytics. Осторожно боты

    После этой операции, трафик с заданного IP учитываться не будет. Плохо то, что почистить накопленные данные нельзя.

  2. Более радикальный способ, это закрыть доступ на уровне файрвола или конфигурации вебсервера.

Выводы

— Некоторые боты могут влияют на показания аналитики;
— Боты могут значительно искажать статистику в GA;
— Если в аналитике появилась странная активность — попробуйте выделить признаки этого трафика и убедится что это не боты;
— Загляните во вкладку «Intelligence Events», аналитика показывает сегменты трафика с нехарактерным поведением;
— Не поленитесь посмотреть в логи вебсервера, там можно найти больше полезной информации для анализа;
— Фильтруйте «мусорный» трафик.

Автор: temaHT

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js