- PVSM.RU - https://www.pvsm.ru -

Хабр как фильтр информационного шума: что делать

Меня немножко достали в последнее время статьи о том что хабр умирает. Ведь правда, чем громче высказывание, тем выше в топе статья. Даже если одна из них основана на неполных и некорректных данных [1], а смысл второй сводится к фразе «я же говорил, что вы ничего не понимаете» и этой милой картинке:
Хабр как фильтр информационного шума: что делать - 1
Да, проблемы есть. Это более менее понятно. Но давайте:
1) Сформулируем эти проблемы. То, что мешает нам читать/постить на хабре интересные статьи. Сформулированная подробно проблема это уже не картинка выше. Это уже огого!
2) Попробуем предложить пути их решения. Я верю, что у администрации много идей. И ещё больше идей они рассматривали. Но тут вроде как тусуется самая просвещённая часть пользователей рунета. Неужели мы не придумаем 1-2 классных новых мысли как сменить минус на плюс? Отличных от «объеденить Хабр, Мегамозг и ГикХаб» и пустить всё на самотёк (это не серьёзно).
Идея с Read&Comment проскакивала в комментариях где-то за месяц до того как администрация её прикрутила. Так что я уверен, что комментарии читаются, хорошие идеи вылавливаются и быстро прикручиваются.

Информационный шум

Чтобы получить информацию, можно пойти к первоисточникам. Интересны IT новости — читайте сайты IT компаний. Интересны статьи по DIY — в вашем распоряжении десяток робо-форумов, групп в Slack, групп вконтакте.
Но есть порочный момент. Сайтов много. Людей, которые хотят пиариться там — ещё больше. Много рекламы. Сколько в день вы готовы потратить на чтение всего этого добра? 15 минут? Час? Сейчас, когда инет есть даже в метро это время может чуть-чуть подросло. Но всё равно его мало.
Хабр как фильтр информационного шума: что делать - 2
Листая источники 90% времени вы потратите в пустую. Потратив 90% времени и получив за оставшиеся 10% одну полу вразумительную статью вы расстроитесь. Этот час вы могли бы потратить с делом.
Именно тут на помощь приходят новостные сайты. Они делают фильтрацию контента для вас. Получается как-то так:
Хабр как фильтр информационного шума: что делать - 3
Такая модель имеет два очевидных минуса — ошибки первого и второго рода. Она может не выловить интересную вам новость, а может наоборот — пропустить неинтересную вам новость. И то и то обидно и досадно.
Чем более специализирован новостной сайт под вашу тематику, сем выше его точность, тем лучше он делает данную фильтрацию. Но даже если это научный сайт общего профиля, то редакторы должны быть в теме.
А что хабр? Хабр во многом такой же. Он фильтрует текущий информационный поток, предоставляя вам итоговую информацию. Только исконный фильтр тут не редакторы, а сообщество.
И да, если релевантность отфильтрованной информации высокая — вы придёте. В не зависимости от того какой тут дизайн, есть ли QsA или Тостер, есть ли статьи GT и хабра в одной ленте.
Как происходит фильтрация информации на хабре?

  • Голосом вверх
  • Голосом вниз
  • Изменением кармы автора (слить неугодного)
  • Подпиской на хабы

Очень важно, что я разделил «голосом вверх» и «голосом вниз». Голос вверх это аналог «лайка». Он означает интерес сообщества. Голос вниз не равнозначен ему. Вниз редко голосуют из-за того, что статья скучная. Вниз голосуют потому что она ужасна, или потому что в ней есть явные ошибки. Или потому что читатель не согласен с ней. Если голос вверх это обычно голос пользователя, то голос вниз это обычно голос эксперта.
Нужно сказать, что когда-то этот фильтр очень хорошо работал. Помните разделение на «отхабренное» и «захабренное»? Вся косячная информация в те времена быстро уводилась на дно и 90% пользователей её не видели. В те времена можно было читать общую ленту постов и она даже была ничего.
Сейчас этот механизм сломался. Я бы даже не сказал, что вина тут администрации. Вина тут пользователей и размытия аудитории. Почему пользователей? Посмотрите на эту статью [2] и на её рейтинг. Да, там есть здравые идеи. Но. Рак поедает ресурс. Как только вы не голосуете в минус за статью переписанную из википедии (или весь смысл которой можно найти первой ссылкой из гугла "COM порт C# [3]") — рак своей клешнёй отрезает ещё кусочек от Хабра.
Минусы чистят от рака. Но, я не уверен, что данный механизм можно вернуть.

Голос вверх — неплохой механизм фильтрации. Но к сожалению, он попсов. Чем попсовее статья, тем выше она будет. Возьмём топ хабра за месяц — habrahabr.ru/top/monthly [4]. Пока я пишу эту статью в топ-10 всего три-четыре хороших технических статьи. Остальным, если честно, место скорее на GT. А часто ли замечательные статьи МосИгры бывают техническими?

Эксперимент

Предлагаю вам простой эксперимент. Сделать Excel-файл с колонками: «Время на прочтение статьи не жалко», «Время на прочтение статьи жалко», «Откровенная реклама, достало», «Подписан ли хоть на один блог, где была выложена статья»(если вы читаете подписку), «Выходила ли статья в топ»(если вы читаете топ). И проглядеть последние несколько дней. Меня этот эксперимент шокировал.
Да, пропусков интересных статей возможно у вас будет мало, если читаете подписку. Но, будет ещё много статей, которые бы были вам неинтересны, но которые вам пришлось просмотреть.

Причины того, что хабр становится сложно читать

С причинами, которые я тут обозначаю можно не соглашаться. У меня нет статистического доказательства. Все выводы я делаю на основе того что вижу и на основе общения с коллегами, которые читают Хабр.

Первая причина

Когда трава была зелёной, то публиковать новость можно было только в один Хаб. Потом в три. Теперь в пять. Могу поспорить, что после каждого из таких изменений администрация радостно отчитывалась о росте трафика. И действительно, в ленту каждого пользователя сразу стало попадать больше статей. Более того, число полезных статей в ленте тоже увеличилось. Но… Давайте вспомним что такое ошибки первого и второго рода.
Хабр как фильтр информационного шума: что делать - 4
Предположим, что можем задать метрику «хорошести статьи» для пользователя (принадлежность к тематике). И есть метод, которым по данной метрике мы можем разделять статьи «одна тематика», «Две тематики», и.т.д.
Выше у нас изображён график хороших статей (синий) и плохих статей (красный). Величиной x является хорошесть статьи в нашей метрике. Величиной y — число статей с данным уровнем «хорошести». Величина c — это наш разделитель (одна тематика, две тематики, и.т.д.).
Величина a1 — это число ошибок «второго рода». Число «плохих» статей, пропущенных в ленту пользователя. Величина a2 — число ошибок «первого рода» — число статей которые мы не выдали пользователю, а он хотел.
Сдвинув разделитель влево (увеличение числа тематик) мы увеличиваем число хороших статей которые выдаём пользователю. Но при этом захламляем ленту.
Какой эффект от этого решения? Первое время пользователь видит сильно больше статей. При этом и тех, которые раньше он считал интересным. Читаемость растёт. Но скоро пользователь перегружает свой канал восприятия информации. И перестаёт доверять методу «подписка на хабы», или отписывается от половины — читаемость падает.

Вторая причина

Да. Вторая причина очевидна всем. Зайдите в будний день и посмотрите сколько статей публикуют компании. Опять же, можно провести эксперимент. Файл в экселе -> колонки «Информация в публикации интересна мне», «Информация в публикации будет интересна достаточно многим», «Информация в публикации — какая то новая техническая», «Информация в публикации — чистая реклама», «Публикации — место на GT».
Внесите сюда дня два. Результат будет удручающим. В некоторые дни публикаций в корпоративных блогах более половины всех публикаций хабра. А статей, которым реально место на хабре — процентов 20-40.
Выгонять компании с Хабра нельзя, так как они — его главные спонсоры. Но что-то делать нужно.

Третья причина

Обилие желтушных заголовков/желтых новостей. На хабре эта проблема не так явна, как на GT. Но там это раздражает. Заходишь прочесть статью — а там совершенно другое и куча желтушных заголовков. При этом 90% таких статей — основные редакторы хабра/GT. Приводит ровно к тому же — пользователь начинает не доверять заголовкам, сдвигая у себя в голове порог. При этом отваливаются и хорошие статьи.

Четвёртая причина

Есть мнение, что ещё одна причина — сокращение хороших статей. Это не тривиальный вопрос. Сложно определить так это или нет. Если честно, то статей по моей тематики как было 3-4 хороших в неделю так и остаётся. Правда многие авторы пропали.
Развлекуха сместилась на ГТ, в основном. Наверное число хороших статей в топе хабра — уменьшилось. Но опять же, это нужно проводить серьёзное исследование, чтобы отмести котлеты от мух. Поэтому данную причину и её производные я не рассматриваю.

Итого

Сейчас на Хабре есть несколько каналов фильтрации информации:

  • «Интересное» — не знаю, как он формируется, но по мне он абсолютно нерепрезентативен
  • «По подписке» — канал фильтрации можно подстроить, но он потерял доверие к себе
  • «Лучшие» — обычно то, что есть тут — реально можно почитать (хотя бы 2-3 статьи), но тут никогда не будет статей специфических по вашей тематике. При этом часто статьям, которые сюда выходят — место на GT
  • «Все подряд» — невозможно читать из-за обилия компаний и мусора

Что делать?

Обычно авторы начинают критиковать Хабр не предлагая путей решения. Я попробую немного нарушить это и выложить пару мыслей.

Идея первая — вес голоса

Идея во многом о том, как попробовать вернуться к старому хабру, когда он был саморегулирующим сообществом, которое может заминусовать плохую статью. Можно рассчитывать вес голоса в зависимости от того, насколько голосующий знаком с тематикой (его вес хабе где лежит статья) и того, насколько данный хаб популярен. По сути: (Число подписанных на хаб)*(Вес автора). Плюсы такого подхода:
• Статьи не будут публиковаться в хабы, которые не имеют отношение к теме. А то жители тех хабов заминусуют. Качество фильтра — улучшается.
• Специалист может оценить хорошую статью точнее. Реально хорошие статьи получат больший охват аудитории (пропорционально числу подписчиков данного хаба на Хабре)
• Рекламные статьи и статьи где автор пробует обмануть будут выфильтровываться значительно эффективнее чем сейчас (помните тут шарлатанскую статью на Хабре, которое сообщество вывело в топ? habrahabr.ru/post/205900 [5], такая статья не единственная, такой чуши в плюсах тут полно)
Минусы:
• Компании сразу попробуют нанять топов хаба, чтобы продвинуть свою статью. И это не отследить
• Предположим топ-10 авторов блога прекратят свою активность на Хабре. Это значит, что статьи этого хаба почти никогда не попадут в топ
• Реперезентативность авторов на топе может быть низка. Например последнее время статьи Яндекса выкладывает одна и та же барышня [6]. У меня сомнения, что она эксперт во всех тематиках. Опять же редакторы Хабра.

Идея вторая — вес голоса избранных участников

Администрация назначит человек по пять выбранных участников на каждый блог. Тех кто имеет активность. Они смогут его редактировать, иметь высокий голос, и.т.д. Это избавит практически от всех минусов прошлого пункта (особенно если люди будут анонимны). В каком-то смысле это движение в сторону Reddit. Но это отход от демократии свойственной Хабру.
А можно проводить выборы и развивать сознательность

Идея третья — автоматизация процесса

У хабра есть чудовищная база.
Например кто за что как голосовал (к сожалению только для тех, кто имеет право голосовать). Но, в принципе, можно и много остальных данных использовать (какая статья открывалась, что добавлялось в избранное, кто на кого подписан, и.т.д.)
Можно с неплохой точностью предсказывать кому что понравиться. Задача, конечно, сложная, большая. Но вполне решаемая. Учитывая, что вся российская тусовка людей, которые занимаются Big Data и машинным обучением бывает на хабре — вполне возможно, что кто-то возьмётся это сделать, даже бесплатно. И этим можно заменить абсолютно нерабочий раздел «Интересные». Думаю, что за маленькую подписку к этому разделу «Powered by ....» смогут поконкурировать и Яндыкс и Мэйлру и куча других фирм.

Идея четвёртая — ничего

Хабр — это офигенная база знаний. Она развивается и накапливается. Но, могу поспорить, что огромная часть трафика — это не постоянные читатели хабра, а переходы по поисковым запросам. И эта часть функционирует хорошо. Эта часть останется с Хабром всегда.

Авторы

Вы скажете «но ведь Хабр умирает не из-за читателей, авторы тоже прекращают писать». Я полностью согласен. Проблема есть и с писателями. Но, на мой взгляд, администрация тут движется в правильном направлении. Введение комментариев Read&Comment — очень хороший шаг. При этом хорошо даже то, что они не введены на Хабре, а оттачиваются на GT. Сейчас в них ещё много проблем, но я верю, что их можно свести на нет.
***********
Всё написанное выше — мой субъективный взгляд, некоторое моё мироощущение. Возможно оно вас заденет. Что ж, тогда минусуйте. Я хочу попробовать сделать это место лучше и удобнее. А минусование — это его огромный плюс;)
Давайте попробуем придумать другие идеи, которые администрация сможет использовать, чтобы сделать хабр лучше и удобнее. Вдруг прокатит?

Автор: ZlodeiBaal

Источник [7]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/habrahabr/115137

Ссылки в тексте:

[1] данных: https://habrahabr.ru/post/278325/#comment_8788985

[2] статью: https://geektimes.ru/post/178747/

[3] COM порт C#: https://habrahabr.ru/post/275439/

[4] habrahabr.ru/top/monthly: https://habrahabr.ru/top/monthly/

[5] habrahabr.ru/post/205900: https://habrahabr.ru/post/205900/

[6] барышня: https://habrahabr.ru/users/Zalina/

[7] Источник: https://habrahabr.ru/post/278739/