Первые три дня жизни поста на Хабре

в 20:57, , рубрики: веб-аналитика, визуализация метрик, математика, поток читателей, статистика, хабр, хабросообщество

Каждый автор переживает за жизнь своей публикации, после опубликования смотрит статистику, ждет и беспокоится за комментарии, желает, чтобы публикация набрала хотя бы среднее число просмотров. У Хабра эти инструменты кумулятивные и поэтому достаточно сложно представить, как публикация автора начинает свою жизнь на фоне других публикаций.

Как известно, основная масса публикаций набирает просмотры в первые три дня. Чтобы представить, как живет публикация, я отследил статистику и представил механизм мониторинга и сравнения. Данный механизм будет применен к этой публикации и все смогут посмотреть, как это работает.

Первым этапом была собрана статистика о динамике публикаций за три первых дня жизни поста. Для этого анализировал потоки читателей, по публикациям за 28 сентября в период их жизни с 28 сентября по 1 октября 2019 г. путем фиксирования количества просмотров через различные промежутки времени в этот период. Первая диаграмма представлена на рисунке ниже, она получена в результате согласования динамики просмотров по времени.

Как можно посчитать из диаграммы, среднее число просмотров публикации через 72 часа при степенной функции аппроксимации составит ориентировочно 8380 просмотров.

Первые три дня жизни поста на Хабре - 1
Рис. 1. Распределение просмотров по времени, для всех публикаций.

Так как явно видны «звезды», то представим эти данные без них для стандартной публикации. Отсечение проведем по тем публикациям, которые набрали больше средней величины просмотров за 3 дня – 10225 шт., рисунок 2.

Первые три дня жизни поста на Хабре - 2
Рис. 2. Распределение просмотров по времени, для средних публикаций, без «звезд».

Как можно посчитать из диаграммы, среднее число просмотров публикации средней востребованности через 72 часа степенной функцией аппроксимации прогнозируется, ориентировочно 5670 просмотров.

Цифры занятные, но есть инструмент с большей практической ценностью. Это средняя доля на каждом временном промежутке. Определим их, и представим на рисунке 3.

Первые три дня жизни поста на Хабре - 3
Рис. 3. Фактическое распределение по времени доли просмотров от общего количества просмотров за трое суток и теоретические линии аппроксимации, тонкая полином Excel и жирная собственное решение.

Проводить отдельный анализ по кластерам «звезды» и обычные публикации особого смысла не вижу, так как в данном решении все считалось в стандартизированной системе координат, по долям.

Таким образом, можно построить таблицу значений с долями от времени и, соответственно прогнозировать общий объем просмотров за трое суток.

Построим указанную таблицу и спрогнозируем поток по этой публикации

Первые три дня жизни поста на Хабре - 4

Так как опубликую пост около 0 часов 3 октября, то каждый может сравнить поток с прогнозируемой величиной. Если он меньше, значит мне не повезло, если больше, значит читателям интересно.

Постараюсь представлять по мере наблюдения реальный поток на графике ниже.

Первые три дня жизни поста на Хабре - 5
Рис. 4. Фактический поток читателей этой публикации в сопоставлении с теоретическим прогнозом.

В заключение могу сказать, что каждый автор может брать для себя ориентиром расчетную таблицу, которая представлена выше. А поделив реальный поток своей публикации в определенный момент на значение в колонке доля для этого момента, может спрогнозировать количество читателей на конец 3-их суток. И в течении этого периода у авторов имеется возможность тем или иным образом повлиять на читаемость его материала, допустим, активнее и подробнее отвечать в комментариях. Также можно сопоставлять свою публикацию с другими, понимать, как внешние публикации влияют на приоритеты читателей. Единственный совет, прошу понимать, что эти цифры получены на анализе потока читателей публикаций всего одного дня, 28 сентября 2019 г.

Автор: Александр Еськов

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js