Рубрики
Статьи

Как победить реферальный спам в Google Analytics одним ударом

100% показатель отказов, 1 страница за сеанс, какие-то левые домены со странными названиями в статистике… Нормально анализировать реферальный трафик становится сложно и неудобно. Думаю, вы видели уже у себя в Google Analytics такое безобразие:

Так выглядит реферальный спам в Google Anaytics
Так выглядит реферальный спам в Google Analytics

Для чего это делается?

Рассыльщики реферального спама надеются, что когда вы зайдете в Google Analytics и увидите переходы с этих сайтов, то зайдете на них посмотреть ради любопытства. Т.е. это — своеобразный источник грязного нецелевого трафика.

А после того, как вы откроете адрес сайта, вас ждет, к примеру, редирект на Aliexpress или любую другую партнерку или сервис.

Как это делается?

В большинстве случаев, реферальный спам рассылается через Measurement Protocol в Google Analytics. Он появляется даже тогда, когда создан счетчик для несуществующего сайта. Т.е. просто отправляются запросы типа:

https://www.google-analytics.com/collect?v=1&tid=UA-123456-1&cid=555&t=pageview&dr=http%3A%2F%2Fref-spam-domain.com

А идентификаторы счетчиков (UA-123456-1 ) просто перебираются или по порядку, или в случайном порядке.

Как отключить реферальный спам?

Можно использовать фильтры с Google Analytics, чтобы фильтровать рефералы по домену, но новые домены для реферального спама появляются с катастрофической скоростью. Поэтому этот вариант — только как временная заплатка. Нужно что-то, что отключит сразу весь реферальный спам, когда боты просто перебирают номера счетчиков в Analytics.

Решение оказалось очень простым (особое спасибо Андрею Москальцу за дельные комментарии). Сейчас я напишу его кратко для тех кто в теме. А потом — разберем по шагам, как его реализовать.

Передаем через пользовательские параметры токен и фильтром включаем сеансы только с этим пользовательским параметром и токеном.

Таким образом, мы исключим все данные, которые генерируется ботами путем отправки данных через Measurement Protocol.

А для нормальных людей мы сейчас разберем, как это сделать по шагам 🙂

1. Создаем пользовательский параметр в Google Analytics

В разделе «Администратор» создаем пользовательский параметр с названием, к примеру, «token» с максимальной областью действия «Пользователь».

Здесь находяться пользовательские параметры в Google Analytics
Заходим в пользовательские параметры в Google Analytics
А так создается пользовательский параметр.
Создаем новый пользовательский параметр с областью действия «пользователь».

Итак, пользовательский параметр «token» мы создали. Идем дальше.

2. Задаем этот пользовательский параметр в коде счетчика

  • Если вы просто поставили код счетчика на сайт, то нужно отредактировать в нем всего одну строчку:
Добавляем пользовательский параметр в код Google Analytics
Добавляем пользовательский параметр в код Google Analytics
  • Если у вас Google Tag Manager, то делаем то же самое, только через GTM. Добавляем прямо к тегу Google Analytics пользовательский параметр с порядковым номером «1» и любым значением.
Добавляем пользовательский параметр через Google Tag Manager
Добавляем пользовательский параметр через Google Tag Manager

3. Создаем копию представления в Google Analytics

Копия нужна для того, чтобы если вдруг вы что-то настроите не так, у вас осталось представление с исходными данными. Это как оставить исходник фотографии при редактировании 🙂

Создаем копию представления в Google Analytics
Создаем копию представления в Google Analytics

4. С помощью фильтра включаем только посещения с заданным нами параметром

В новом представлении, которое вы только что создали мы настраиваем фильтр так, чтобы включать сеансы только для тех посещений, у которых проставлен наш пользовательский параметр. Т.е. для всех нормальных людей, которые заходят на сайт через браузер.

Создаем фильтр в Google Analytics, который пропускает только посещения с нашим пользовательским параметром.
Создаем фильтр в Google Analytics, который пропускает только посещения с нашим пользовательским параметром.

Фильтр реферального спама настроен!

Теперь в новом представлении будут отображаться только данные реальных посетителей вашего сайта, у которых есть браузер и работает javascript. Или очень умных ботов, выполняющих javascript… благо, что это очень уже ресурсозатратно и дорого для спаммеров 🙂

Вопросы, идеи и предложения пишите в комментариях!

Автор: Алексей Ярошенко

Data Scientist / ML Engineer. Раньше занимался интернет-маркетингом и учил людей контексту. Сертифицированный тренер Google в Беларуси.

Добавить комментарий

Ваш адрес email не будет опубликован.

This site uses Akismet to reduce spam. Learn how your comment data is processed.