Хабрастатистика: небольшой анализ популярности хабов

в 21:06, , рубрики: matplotlib, pandas, python, веб-аналитика, визуализация данных, интерфейсы, Программирование, Социальные сети и сообщества, статистика, хабр

При подготовке материалов к рейтингу статей и авторов этого года (если кто не читал, ссылка здесь и здесь), я нашел довольно интересную закономерность, которую вроде бы статистически еще никто не рассматривал. Речь пойдет о популярности разных разделов (хабов) здесь на Хабре.

image

Статья будет интересна скорее «писателям», еще не определившимся, в какой хаб писать новый шедевр, «читатели» могут решать сами, читать или нет.

Подробности под катом.

Как всегда, традиционный disclaimer: все подсчеты и рейтинги являются неофициальными, и я не исключаю что нигде не ошибся.

А теперь, приступим. Сегодня мы рассмотрим подробнее разные хабры Хаба, т.е. наоборот, хабы Хабра :) В качестве «разминки» посмотрим топ хабов по числу просмотров:

Хабрастатистика: небольшой анализ популярности хабов - 2

Тут ничего неожиданного, и картинка более-менее соответствует «официальному» рейтингу на https://habr.com/ru/hubs/. Однако число просмотров в чистом виде сложно сравнивать, т.к. оно зависит от количества статей, которое для всех хабов различно. Гораздо более интересные результаты получаются если вывести топ хабов по среднему числу просмотров за статью:

Хабрастатистика: небольшой анализ популярности хабов - 3

Тут все становится куда более забавно. С заметным отрывом побеждает хаб… brainfuck, в котором впрочем, довольно мало статей, зато почти все из них получили высокие рейтинги. Популярность web_monetization понятна — деньги интересны всем, ну а примета времени — довольно высокое число просмотров у хаба it_immigration, в который за этот год было написано кстати, 86 статей, многие из них с довольно высоким рейтингом.

Раз уж речь зашла о рейтингах, можно построить статистику и по ним. Посмотрим, какое среднее количество голосов читателей набирают статьи в разных хабах:

Хабрастатистика: небольшой анализ популярности хабов - 4

На первом месте анонсы хабра — и это понятно. Остальное в принципе, видно из названий, все перечислять смысла нет. Можно лишь отдельно отметить довольно экзотический хаб demoscene, в котором обсуждаются странные штуки типа программирования на БК-0010, ну и уже вышеупомянутый brainfuck, который победил почти всех c практически двухкратным отрывом. И на удивление, в топ-10 попал Perl, хотя статей по нему в 2019 было довольно мало.

Раз уж речь зашла о программировании, перейду к грустной части. Многие авторы наверно замечали, что узконаправленные статьи по программированию на Хабре практически «не идут». И хотя это было на уровне ощущений, теперь это можно подтвердить статистически.

Увы, с популярностью статей по ЯП на Хабре в плане рейтингов все действительно довольно грустно:

Хабрастатистика: небольшой анализ популярности хабов - 5

В общем, было и так интуитивно понятно что статья про распознавание изображений в OpenCV никогда не догонит по рейтингам статью про мошенничество в Мегафоне, ну теперь этому есть статистическое доказательство. Хотя в качестве исключения, Perl (9 статей), Rust (61 статья) и Haskell (16 статей) держатся по средним баллам весьма неплохо.

Что в этом списке вообще делает Delphi (18 статей, в 2019 году!) не очень ясно, но оказывается, в хабе по нему некоторые археологи еще что-то пишут.

Кстати, если кому интересен рейтинг самых «унылых» хабов по числу голосов, то его тоже несложно вывести:

Хабрастатистика: небольшой анализ популярности хабов - 6

Интересно также объединить хабы в большие группы. Первая группа — хабы «не про программирование», куда можно отнести «карьеру», «гаджеты», «здоровье» и пр, из них я взял 10 самых популярных. Вторая группа — все хабы Geektimes, которых довольно много. Три остальные группы — профильные хабы, языки программирования и администрирование.

Хабрастатистика: небольшой анализ популярности хабов - 7

Результат предсказуем — «топовые» хабы получают наибольшие рейтинги, хабы Гиктаймс тоже вполне положительно оцениваются читателями, все остальное, увы, имеют заметный отрыв.

Кстати, стало интересно, как выглядели голоса статей по профильным хабам 10 лет назад, в далеком, 2009м году.

Лучше не смотреть

Хабрастатистика: небольшой анализ популярности хабов - 8

Для понимания порядка величин, в хаб «Алгоритмы» тогда было написано 30 статей со средним рейтингом +67, сейчас написано 486 статей, но средний рейтинг упал до +29.

Заключение

Главный вывод — пора учить Brainfuck.

Статья задумывалась скорее «для прикола», чтобы посмотреть какие-то забавные закономерности, но в итоге получилась отчасти грустной. Хотя честно, я не хотел, и цель была не в этом. По крайней мере, ищущие темы новых статей для Хабра могут теперь делать это с более научным подходом, и выбирать хабы более осмысленно. Вряд ли я открыл Америку, скорее всего вышенаписанное все постоянные читатели и писатели Хабра интуитивно знали и так, но проверить статистически было интересно.

Ваш кэп.

Автор: DmitrySpb79

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js