- PVSM.RU - https://www.pvsm.ru -

Алгоритм определения естественности информационного всплеска

image

Прототип алгоритма определения происхождения информационного всплеска.


Рассмотрим частоту вхождения нормального (естественного) события (новости) в каналы коммуникаций:

  1. Появления события (новость, рекламное сообщение, публикация статьи). X(initial) = 1
  2. Если событие достаточно интересно то происходит его естественное размножение (плавный рост)
  3. Частота цитирования достигает пика
  4. После пика происходит плавный спад частоты цитирования данного события.

В данном случае график частоты цитирования будет иметь вид нормального распределения (гауссианы)
image

Теперь рассмотрим частоту вхождения искусственного вброса информации (новости):

  1. Появление события (новости). Возможно появления сразу в нескольких источниках (Информационных агентствах). X(initial) > 1
  2. Стремительное размножение события, подогреваемое множественными вбросами.
  3. Частота цитирования достигает пика и продолжает держаться, благодаря искусственному и постоянному подогреву интереса к событию.
  4. После окончания акции (вброса, раскрутки, накрутки) происходит стремительный спад цитирования данного события.

Данный график будет отличаться от нормального распределения (гауссианы): кривая роста будет более крутая, начальные значения могут быть больше единицы (X(initial) > 1), на месте пика будет наблюдаться плато.
image

image

Таким образом, анализируя зависимость частоты вхождения события в информационное пространство, можно получить характеристику его происхождения. Тем самым реализуется ранжирование события по его происхождению.

Интересные ссылки

Нормальное распределение [1]
PageRank [2]
Кластерный анализ [3]

Автор: shrimo

Источник [4]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/poiskovy-e-sistemy/26815

Ссылки в тексте:

[1] Нормальное распределение: http://ru.wikipedia.org/wiki/%D0%9D%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%BE%D0%B5_%D1%80%D0%B0%D1%81%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5

[2] PageRank: http://ru.wikipedia.org/wiki/PageRank

[3] Кластерный анализ: http://ru.wikipedia.org/wiki/%D0%9A%D0%BB%D0%B0%D1%81%D1%82%D0%B5%D1%80%D0%BD%D1%8B%D0%B9_%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7

[4] Источник: http://habrahabr.ru/post/168941/