Это исследование родилось, когда я готовилась к докладу на конференции ITSConf со своим материалом по трендам в IT-маркетинге в конце декабря 2024 года. Один из блоков естественным образом был посвящён волатильности выдачи Google и его апдейтам. И в процессе сбора и анализа информации у меня в очередной раз возник вопрос: а каков же на самом деле масштаб деиндексации?
В этой небольшой статье не будет чётких и выверенных ответов на данный вопрос. Но будут интересные цифры, которые могут навести каждого из нас на определённые мысли или обратить внимание на источники, позволяющие извлекать дополнительную информацию из стандартных отчётов.
Во время сбора информации первым делом, конечно, на глаза попалось громкое исследование от сервиса originality.ai, которое было проведено в период мартовского апдейта Google в 2024 году. Исследований такого характера и масштаба в принципе немного, поэтому материал получился заметным и обсуждаемым. Команда сервиса зафиксировала трафик 79 000 сайтов до апдейта (в феврале 2024 года), а затем — повторно проверила их наличие в выдаче после обновления.
Оказалось, что около 1 500 сайтов были деиндексированы, что составляет примерно 2% от общего количества попавших в эксперимент сайтов.
Полторы тысячи в рамках Google — немного. Но если масштабировать эту долю на всё информационное поле интернета, которое насчитывает миллиарды сайтов, то в гипотетической пропорции речь может идти о миллионах ресурсов.
В процессе своего анализа я наткнулась на ежемесячные отчёты Netcraft — компании, занимающейся системным мониторингом, SSL, DNS и аналитикой угроз. Уже много лет они публикуют два показателя:
• Active Sites — сайты, которые содержат уникальный и актуальный контент. Конкретная методика определения того, что именно попадает под категорию «уникальный актуальный сайт», в отчётах Netcraft не раскрывается. Тем не менее, я буду исходить из разумного допущения, что речь идёт о сайтах с достаточно уникальным контентом и регулярным обновлением материалов.
• Total Sites — все сайты, давшие HTTP-ответ.
Очевидно, что в метрике “все сайты” присутствует значительное количество мусора, парковок и временных доменов, поэтому в качестве опоры для анализа я взяла именно Active Sites.
Также я заметила, что отчёты публикуются преимущественно в 20-х числах каждого месяца. Это позволяет предположить, что данные в них были собраны в начале месяца — примерно 1–2 числа. Этот нюанс оказался важным при дальнейшем сопоставлении с датами апдейтов Google.
Какова связь между деиндексацией и «живыми» сайтами?
Возникает логичный вопрос — а какая вообще связь между деиндексацией Google и показателями активных сайтов по версии Netcraft, основанной на серверных ответах?
Связь, которую я наблюдаю, следующая: после того как сайт исключён из индекса Google, владелец сайта, особенно если это не крупный бренд, с высокой вероятностью не будет заниматься возвратом ресурса в индекс. Процесс восстановления требует времени, компетенций и усилий. Гораздо проще — создать новый домен, новый сайт и начать всё заново.
В результате, после потери индексации:
сайт может быть заброшен,
не продлён,
домен не продлён,
сайт отключён — и в итоге он перестаёт давать HTTP-ответ и исчезает из статистики активных сайтов.
📌 Восстанавливать упавший сайт будут только крупные, корпоративные или институциональные проекты, для которых важна история, SEO-репутация и доверие поисковиков. А среднестатистический лендинг, блог или небольшой бизнес-сайт просто забудет про домен и запустит новый проект.
Таким образом, динамика падений активных сайтов может быть косвенным отражением деиндексации Google — не как прямая метрика, а как цепная реакция, следующая за алгоритмическими санкциями.
Апдейты Google 2022–2024 гг.
На графике ниже жёлтым цветом я отметила Core Updates, подтверждённые Google в период с 2022 по 2024 годы. Эти обновления алгоритмов могли значительно повлиять на поведение сайтов в выдаче и привести к их деиндексации.
Рисунок получился довольно неровным.
Во многих случаях видно, что в течение месяца после апдейта фиксируется заметное падение количества активных сайтов. Это может быть как прямым следствием апдейта, так и совпадением — но тренд наблюдается.
К ним я отнесла те, которые, по реакции SEO-сообщества, можно считать наиболее жёсткими — повлекшими за собой заметные изменения в выдаче:
Дата начала
Название
Тип апдейта
Период развёртывания
Комментарий
25 мая 2022
May 2022 Core Update
Core Update
25 мая – 9 июня 2022
Основное обновление алгоритма
12 сентября 2022
September 2022 Core Update
Core Update
12–26 сентября 2022
Существенные колебания, значимый охват
5 декабря 2022
Helpful Content Update
Content Update
5 дек. 2022 – 12 янв. 2023
Низкое влияние на видимость по отзывам
14 декабря 2022
Link Spam Update
Spam Update
14 дек. 2022 – 12 янв. 2023
Против ссылочного спама, частично повлияло на сайты с линкбилдингом
15 марта 2023
March 2023 Core Update
Core Update
15 марта – 28 марта 2023
Умеренная волатильность
22 августа 2023
August 2023 Core Update
Core Update
22 авг. – 7 сент. 2023
Сильное влияние, большое число деиндексаций
5 октября 2023
October 2023 Core Update
Core Update
5 – 19 окт. 2023
Высокая волатильность
8 ноября 2023
November 2023 Reviews Update
Reviews Update
8 – 17 нояб. 2023
Влияние на контент обзоров
5 марта 2024
March 2024 Core Update
Core Update
5 – 20 марта 2024
Масштабное обновление, Google заявил о борьбе с низкокачественным контентом
Серым цветом обозначены неподтверждённые апдейты — периоды нестабильности, о которых сообщали SEO-эксперты, но которые Google официально не комментировал. Хотя мы не можем точно утверждать, что в эти периоды происходили технические апдейты, их влияние на флуктуации в выдаче и индекс Google может быть значительным.
Дата начала
Название
Тип апдейта
Период развёртывания
Комментарий
10 мая 2023
«Google I/O» Update (неподтв.)
Неподтверждённый
май 2023
Замечена волатильность, совпала с конференцией Google I/O
15 июня 2023
June Volatility (неподтв.)
Неподтверждённый
июнь 2023
Повышенная волатильность
10 июля 2023
July Calm (неподтв.)
Неподтверждённый
июль 2023
Штиль, минимальная волатильность
Также стоит отметить, что в апреле 2023 года происходил апдейт обзоров (Reviews Update), который разворачивался в период с 12 по 25 апреля. Хотя его влияние не было столь масштабным, как у Core Updates, многие специалисты отмечали повышенную волатильность в выдаче в этот период.
Цифры: как менялось количество активных сайтов до и после апдейтов
Значения округлены. В зависимости от дат и продолжительности апдейта я брала цифры на момент его начала и через месяц после
Update
Start Date
Before (M)
After (M)
Change (M)
May 2022 Core
2022-05-25
198
197
-0.9
Sep 2022 Core
2022-09-12
200.2
198.5
-1.7
Dec 2022 Helpful
2022-12-05
202,9
202
-0,9
Dec 2022 Link Spam
2022-12-14
202,9
202
-0,9
Mar 2023 Core
2023-03-15
201.2
201
-0.2
Aug 2023 Core
2023-08-22
200.8
191.6
-9.2
Oct 2023 Core
2023-10-05
191.6
191
-0.6
Nov 2023 Reviews
2023-11-08
191
189.4
-1,6
Mar 2024 Core
2024-03-05
194.4
193.5
-0.9
Эти значения не означают, что именно Google вызвал падения,
но он по всем признакам явно отразился.
Влияние оказывали также и естественные циклы жизни сайтов, а также другие факторы:
автоматическое удаление старых или неактивных сайтов;
Тем не менее, обратите внимание: наиболее крупное падение совпадает именно с августовским апдейтом 2023 года, который был отмечен своей жёсткостью.
👉 Начиная с 2024 года Google сообщил, что не будет уведомлять о каждом отдельном апдейте, поэтому, к сожалению, конец 2024 года и начало 2025 на графике остаются без подписей — хотя движение продолжается.
Иные резкие перепады
Помимо явно отмеченных на графике Core Updates, можно увидеть и другие периоды заметного снижения количества активных сайтов. Некоторые из них совпадают с менее очевидными или неподтверждёнными обновлениями алгоритмов.
Ноябрь 2022 года: значительное снижение без официального анонса. Возможные причины — внутренние корректировки, инфраструктурные сбои или геополитический контекст.
Февраль 2023 года: зафиксировано заметное падение, хотя официальных обновлений не было. Возможно, это связано с сезонными изменениями или техническими сбоями.
Декабрь 2022 — январь 2023 года: в этот период проходили сразу два официальных обновления:
Helpful Content Update (5 декабря 2022 – 12 января 2023)
Link Spam Update (14 декабря 2022 – 12 января 2023)
📈 Отдельные резкие скачки вверх на графике, к сожалению, пояснить сложно — для этого потребуется дополнительное исследование. Однако глядя на рост даже после крупных падений, можно предположить, что прирост количества сайтов всё же перекрывает естественный отток.
Геополитические события: влияние войны в Украине
❗ Февраль 2022 года — на графике это высокая точка. Но уже в марте и последующих месяцах фиксируется устойчивое и заметное падение. Одним из возможных факторов может быть начало войны России с Украиной (24 февраля 2022 года).
Как это могло повлиять на индекс Google:
массовые блокировки и цензура в интернете (отключение СМИ, VPN и соцсетей);
прекращение обслуживания сайтов западными хостингами и регистраторами;
уход международных компаний и, как следствие, закрытие или удаление локальных сайтов;
кибератаки и DDoS, добровольное или вынужденное закрытие сайтов;
блокировки в поиске и недоступность по геолокации или в связи с санкциями.
📉 Всё это могло привести к фактическому исчезновению десятков или сотен тысяч сайтов из индекса — даже если не напрямую по инициативе Google.
Это подчёркивает, что деиндексация — это не всегда вопрос качества, а также вопрос инфраструктуры и внешних обстоятельств.
Общие выводы
Глядя на график и наложенные на него апдейты, можно увидеть определённую корреляцию между периодами обновлений и последующим снижением количества активных сайтов.
В дополнение к визуальному анализу я рассчитала примерные цифры, показывающие динамику падений в течение месяца после крупных апдейтов:
Общее снижение количества активных сайтов после ключевых обновлений Google составило примерно 14,98 млн сайтов;
В среднем, каждый такой апдейт сопровождался изменением количества активных сайтов на 1–2 млн сайтов в течение 1–1,5 месяца после его запуска.
📎 Какова доля естественного оттока сайтов? Точно сказать нельзя.
Эти значения не являются универсальными, но они дают ориентир масштабов возможного влияния обновлений Google на структуру веба.
Является ли это совпадением или закономерностью?
Можно, конечно, назвать всю картину немного «подтянутой за уши».
Но в то же время, если понимать, что ключевые апдейты действительно вели к выпадению из индекса большого количества сайтов, то можно сделать предположение: уменьшение числа сайтов, дающих HTTP-ответ, через месяц после апдейта — это косвенный индикатор масштабов пострадавших сайтов.
Причём, как показывает картина падений во второй половине 2023 года (особенно после августовского и октябрьского апдейтов), масштаб может варьироваться очень сильно. Плюс буду честна, в данном исследования я не трогала Яндекс и его апдейты, сфокусировав свое внимание только на штормах от Google.
❗ Поэтому такие предположения нельзя считать универсальными или использовать для прогнозирования.
Но когда такие совпадения происходят систематически — это интересная отправная точка для дальнейших исследований.
Это исследование — не окончательный вердикт, а приглашение подумать шире: о масштабах влияния алгоритмов на структуру и судьбу сайтов в сети.