Что такое реферальный спам?
Это поддельный трафик (созданный ботами и поисковыми роботами) — не что иное, как поддельные посещения, которые приходят с очень подозрительных и необычных веб-сайтов. Этих посещений на самом деле никогда не было, но они отображаются в отчетах, как реальные.
Это искажает данные аналитики и портит анализ: вы не всегда сможете четко распознать, когда количество посещений является спамом, потому что иногда домены выглядят совершенно нормально. Однако в большинстве случаев их легко определить не только по домену, но и по 100% показателю отказов и времени нахождения на сайте (равно нулю).
Вот несколько примеров:
bot-traffic.icu
trafficbot.life
traffic2money.com
trafficmonetizer.org
get-free-social-traffic.com
free-social-buttons.com
Итак, почему существуют боты? Хорошие боты помогают Google и другим поисковым системам сканировать веб-страницы, чтобы правильно размещать их в результатах поисковой системы. Плохие боты сканируют контент по ряду злонамеренных причин, к примеру, чтобы атаковать веб-серверы, воровать данные или контент или увеличивать расходы владельцев сайтов.
Давайте разберемся, какие есть способы решить эту проблему и избавить сайт от такого рода неприятностей.
Боты и спам в Google Analytics: как избавиться
Ваша учетная запись Google Analytics разделена на несколько уровней:
- Первый уровень — Account. Как правило, это название компании;
- Второй уровень — Property. Это должен быть сайт, куда отправляются данные;
- Третий и последний уровень — View. Как только данные отправляются на ресурс, они обрабатываются сервером Google и отображаются. По умолчанию он будет называться Все данные веб-сайта.
Этот процесс можно изменить с помощью фильтров в зависимости от потребностей.
Фильтры — это инструкции, которые получает от вас Google Analytics. Они будут применяться во время обработки данных, прежде чем сделать их доступными для просмотра.
Фильтр можно применить к определенному представлению, например, вы можете создать фильтр для удаления всего трафика, исходящего из вашего ноутбука, на основе его IP-адреса.
По мере обработки данных Google будет удалять (или фильтровать) трафик. Это помогает сохранить данные не замусоренными, пока вы внутренне тестируете маркетинговые воронки сайта. Но фильтры — это еще и основное оружие против спама.
1. Создайте фильтр имени хоста
Этот фильтр для ваших имен хостов, поэтому, если вы добавите его, то не исключите реальный трафик. Спам использует протокол измерений для прямого доступа к Google Analytics, но не посещает сайт. А значит, он всегда оставляет поддельное или неопределенное имя хоста, которое отображается как не задано в отчетах.
Сначала перейдите к сетевому отчету в аналитике и выберите вкладку Имена хостов в верхней части отчетов. Составьте список всех действительных доменов. Это, конечно, домен вашего сайта, и дополнительные домены, где есть код отслеживания Google Analytics.
Следующий шаг — превратить этот список в регулярное выражение. Оно выглядит приблизительно так:
gdetraffic\.com|youtube\.com|instagram\.com|facebook\.com
Все, что вам нужно сделать, чтобы получить регулярное выражение, это ввести каждый домен, затем поставить обратную косую черту \ перед любой точкой и отделить домены вертикальной чертой |. Между доменами не должно быть пробелов.
Теперь давайте создавать фильтр:
1. Перейдите на вкладку Админа;
2. Выберите Фильтры и кликните на + Добавить фильтр;
3. Введите имя фильтра;
4. В типе фильтра выберите Пользовательский;
5. Кликните на Включить и выберите Имя хоста в раскрывающемся списке;
6. Скопируйте и вставьте выражение имени хоста;
7. Нажмите Сохранить. Теперь вы знаете, что данные поступают только с указанных вами веб-сайтов.
2. Создайте фильтр для сканеров и языкового спама
Спам от сканеров сложнее обнаружить, так как он использует действительное имя хоста, поэтому понадобится другой фильтр с выражением, которое соответствует спаму от сканеров:
1. Перейдите на вкладку Админа;
2. В последнем столбце Вид выберите Фильтры, а затем нажмите + Добавить фильтр;
3. Введите Crawler Spam Filter в качестве имени;
4. Тип фильтра > Пользовательский > Исключить;
5. Поле фильтра > Источник кампании;
6. Шаблон фильтра > Вставьте выражение спама сканера;
7. Сохраните.
Ниже выражения оптимизированы для блокировки всего спама, обнаруженного поисковыми роботами за последние пару лет.
Создайте фильтр для каждого выражения:
Выражение 1:
(best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)
Выражение 2:
datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter
Выражение 3 (для языкового спама):
Выполните те же действия, но вместо Источник кампании выберите Языковые настройки
\s[^s]*\s|.{15,}|\.|,
3. Исключите всех известных ботов
Это, например, те, которые сканируют сайт для индексации. В Google Analytics есть встроенная функция для исключения этого трафика.
1. Для этого перейдите на третий уровень View;
2. Кликните на View settings;
3. И рядом с Bot Filtering поставьте галочку.
4. Избавьтесь от спама в существующих отчетах
Чтобы удалить спам из ваших исторических данных Google Analytics, создайте сегмент:
1. Перейдите в раздел Источники трафика > Весь трафик > Каналы;
2. Нажмите на поле Вторичное измерение и введите Источник/Канал;
3. В верхней части этой страницы нажмите Добавить сегмент;
4. Нажмите + Новый Сегмент;
5. Кликните Условия на боковой панели, вы должны увидеть это:
6. В первом раскрывающемся списке нажмите Поведение > Имя хоста;
7. Во втором раскрывающемся списке выберите соответствует регулярному выражению;
8. В пустом поле скопируйте и вставьте приведенную ниже строку:
offer|free\-|share\-|mercedes|buy|cheap|googlsucks|benz|sl500|hulfington|buttons|
darodar|pistonheads|motor|money|blackhat|backlink|webrank|seo|phd|crawler|anonymous|\d{3}.*forum|porn|webmaster|flipboard|fl\.ru|mbca|ahrefs|game|\.io|^sex|^video
9. Нажмите кнопку или, и увидите всплывающее окно с другим идентичным разделом, и на этот раз скопируйте и вставьте эту строку:
dailyrank|100dollars-seo|anticrawler|sitevaluation|buttons-for-website|buttons-for-your-website|-musicas*-gratis|best-seo-offer|best-seo-solution|savetubevideo|ranksonic|offers.bycontext|7makemoneyonline|kambasoft|medispainstitute
10. Нажмите кнопку или еще раз и скопируйте и вставьте эту строку:
127.0.0.1|justprofit.xyz|nexus.search-helper.ru|rankings-analytics.com|videos-for-your-business|adviceforum.info|video—production|success-seo|sharemyfile.ru|seo-platform|dbutton.net|wordpress-crew.net|rankscanner|doktoronline.no|o00.in
11. И последний раз, вставьте это:
top1-seo-service.com|fast-wordpress-start.com|rankings-analytics.com|uptimebot.net|^scripted.com|uptimechecker.com
12. Проверьте, чтобы для всех этих параметров было установлено Имя хоста и соответствует регулярному выражению.
Давайте подведем итоги
Google усердно работает над уточнением аналитических данных, но волшебного решения, позволяющего полностью избавиться от спама, к сожалению, нет. А это значит, если у вас есть веб-сайт, вы будете сталкиваться со спамом. Но в игре «кошки-мышки» кошка обычно побеждает, так что важно регулярно очищать свою аналитику и следить за тем, чтобы в нее попадали только хорошие данные. Потратьте несколько минут на настройку фильтров, и успешно устраните почти весь спам. Надеемся, вам с этим поможет наше руководство!