Предвыборная гонка глазами поисковых роботов

в 23:22, , рубрики: big data, data mining, statoperator, выборы, Исследования и прогнозы в IT

Предвыборная гонка глазами поисковых роботов - 1

Мы ежедневно выполняем срез документов, расположенных на главных страницах миллиона самых посещаемых сайтов мира. Сегодня рассмотрим, как количество упоминаний кандидатов в президенты РФ коррелирует с происходящими оффлайн событиями.

Ссылка на график, шкала — линейная

Цифра соответствует количеству найденных упоминаний в тексте из корпуса html-документов получаемого краулером ежедневно, что позволяет нам выводить индекс для каждого кандидата. Обычно мы строим подобные индексы по брендам для маркетологов/pr-специалистов, но выборы — событие историческое.

Признаться, подошли мы к этому вопросу с некоторой халатностью, Собчак добавили каким-то чудом перед тем, как она объявила о своем желании выдвинуть кандидатуру, Грудинина уже когда стало понятно, что без него банкет не состоится. С другой стороны, у нас не было цели сделать доскональный анализ технологий кандидатов, хотели посмотреть как ведут себя топы.

На графике в начале темы мы можем наблюдать динамику упоминаний кандидатов. Шкала линейная, Путин улетел, сильнее всего к его индексу приближалась Собчак (когда объявила о своем выдвижении) и Навальный (когда ему ЦИК отказал в регистрации). Здесь шкала логарифмическая.

Рассмотрим детали

Путин

Предвыборная гонка глазами поисковых роботов - 2

1) Прямая линия с президентом
2) Встреча Путина и Трампа
3) День рождения Путина
4) Отмена встречи с Трампом
5) Выдвижение кандидатуры на пост президента
6) Большая пресс-конференция Владимира Путина
7) Обращение к федеральному собранию
____

Навальный

Предвыборная гонка глазами поисковых роботов - 3

1) Организовал митинг
2) Навальный продал «Лайфу» видео про «отдых Навального во Франции». Заработал 10 тысяч рублей для своей президентской кампании. Meduza. Параллельно запустилась сеть сайтов по продаже атрибутики к выборам с символикой Навального. Именно эта сеть так задрала фон.
3) Протестные акции сторонников Алексея Навального
4) ЦИК отказал в регистрации
5) Протестные акции сторонников Алексея Навального
6) Сайт Навального внесли в черный список
____

Собчак, Жириновский

Предвыборная гонка глазами поисковых роботов - 4

1) МОСКВА, 4 сентября. /ТАСС/. Лидер ЛДПР Владимир Жириновский признался, что ему были неприятны публикации в российских СМИ, где утверждалось, что одним из кандидатов на предстоящих выборах в марте 2018 года будет женщина.
2) Рождение Собчак, как кандидата в президенты. Хочется отметить, что фон упоминаний как влетел с уровня Жириновского, так полностью и не откатился.
3) Собчак облила Жириновского водой во время дебатов
____

Грудинин, Жириновский

Предвыборная гонка глазами поисковых роботов - 5

С Грудининым одни скандалы, ничего интересного (Жириновский для масштаба)
____

Общий вид

Предвыборная гонка глазами поисковых роботов - 6

График будет обновляться ежедневно, система продолжает собирать данные, посмотрим, как события будут развиваться в последнюю неделю до голосования.

Интересные наблюдения

1) У Жириновского самый сильный инфоповод за историю наблюдений — скандал с Собчак, количество упоминаний самое низкое.
2) Грудинин скандалами запутал всех, но бьется в одной куче с остальными.
3) Так, как о Собчак написали в тот день, когда она объявила о своем желании — не писали больше никогда (пока).
4) Навальный падает.
5) Информационная волна от выступления Путина с посланием Совету Федерации сравнима с первой встречей с Трампом.

P.S. Если кто-нибудь захочет провести собственное исследование, например, посчитать что-нибудь о кандидатах в новостных заголовках — пишите в личку, поделимся датасетами.

Автор: daocrawler

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js