Хабра-детектив на выходных

в 8:58, , рубрики: DIY, diy или сделай сам, habrbusters, Лайфхаки для гиков, никто не читает теги, Социальные сети и сообщества, Статистика в IT, хабр, хабра-детектив, хабра-теория заговора

Хабра-детектив на выходных - 1
Вы ведь знаете, что такое дежавю? То самое "это уже где-то было", только не про последний вышедший в кинотеатре фильм, а про то, что происходит именно с вами.

К примеру, не казалось ли вам, что вы уже видели какую-либо статью на Хабре раньше? В большинстве случаев, в этом нет ничего плохого. Технические статьи зачастую содержат уже опубликованную ранее информацию — они доработаны, перепроверены и просто улучшены. Ну а новости — с ними надо просто смириться.

Итак, давайте посмотрим, действительно ли это уже было, проведя небольшое расследование.

Начало

Моё дежавю началось с этого изображения. Стоит отметить, что я не читаю большинство постов, а лишь просматриваю заголовки и картинки до тега < cut/ > и листаю дальше. Потому безобидный JPG и бросился в глаза — он уже где-то был недавно.

Хабра-детектив на выходных - 2

Рис. 1. КДПВ из "Языковые слои" (2019-11-20)

К тому же, я уже точно видел переводы постов Robert C. Martin совсем недавно. Найти их было не сложно — все три. КДПВ "Три парадигмы" (2019-11-12) — то же самое изображение на hsto.org.

"Ну и что?" — спросит каждый, кто дочитал до этой фразы. Конечно, авторы постов на одну тематику часто используют похожие изображения для привлечения внимания, а заодно экономят место на hsto.org. Для начала скажу, что авторы упомянутых постов разные (Harhencko и Simple219 соответственно). А вот качество перевода у них похоже, точнее "Перевод немного странный".

Но вернёмся к третьему посту-переводу, о котором я уже упомянул — "Слишком чисто?" (2019-11-16).

КДПВ

Хабра-детектив на выходных - 3

Рис. S1. КДПВ из "Слишком чисто?" (2019-11-16)

Да, КДПВ формально другая — она успокоила мою паранойю, и я принялся читать перевод. Не будем останавливаться на качестве перевода, лишь замечу, что после прочтения я увидел логин автора и паранойя вернулась. Пост написан yanaharchencko. И это не тот пользователь, что Harhencko.

Что ж, теперь я просто не мог остановиться. Я должен был узнать, сколько на Хабре опубликовано таких же переводов.

Расследование

Первый шаг в нашем псевдо-детективном расследовании — найти общее. На Хабре публикуется много всего и необходимо было сузить круг подозреваемых. Всё начинается с "Привет! Предлагаю вашему вниманию перевод статьи" — стандартного начала. Наверняка, оно подставляется НЛО, которое выпускает посты из Песочницы. Стоп, песочница — именно оттуда все три поста. На самом деле, лишь два из трёх, однако это я заметил позже и моя начальная оплошность никак не повлияла на расследование. И все они — переводы. Для начала нам этого хватит.

Всего на момент первого поиска (2019-11-20) я нашел 37 подобных постов до 2019-07-15 включительно. 14 из них были опубликованы в ноябре. Возможно, я пропустил некоторые из таких же за этот период — поиск производился вручную, ведь как настоящий детектив я не доверяю никому, даже компьютеру. Стоит отметить, что на момент написания этой части текста (2019-11-23), добавилось ещё 5 постов-переводов из песочницы. При этом один из них был отправлен в дальний космос минусов и скрыт автором.

Итак, у нас есть 41 + 1 пост — что нам известно про них и их авторов. У 10 авторов больше, чем 1 пост, максимум — 7 штук от одного. Будем считать, что эти пользователи действительно активные участники Хабра-сообщества. 12 из оставшихся 32 зарегистрированы на сайте до 2019 года, а некоторые из них ещё в 2012. Ещё два пользователя были зарегистрированы за 119 и 109 дней до того, как опубликовали свои первые посты.

После такой грубой фильтрации осталось 18 зарегистрированных. Давайте посмотрим статистику их переводов. Рейтинги варьируются от -19 за "Эти 10 каналов с прямыми трансляциями сделают вас лучше в программировании" (и он же получил больше всего минусов — 24) до +33 за уже упомянутый Слишком чисто? (с максимумом в 46 плюсов). Пост 10 лучших практик для проектирования баз данных был скрыт до сбора статистики от 2019-11-23 (но я видел там много минусов, хотя верить мне не обязательно).

Статистика авторов немного другая — больше всего голосов за карму получил пользователь yanaharchencko — 21 (что не помогло сумарной карме в 6.2), а самый низкий кармо-рейтинг у evelina_n — 0 кармы с 12 голосов. Лишь один из пользователей комментировал разные посты на Хабре и потому его мы тоже исключим из рассмотрения. Пятеро комментировали свои посты и ещё 12 не написали ни одного комментария.

Но что-то же должно быть общего между этими пользователями? Найти ответ оказалось не сложно. Достаточно было просто зайти во вкладку подписан на / подписчики. И тут меня ожидал ответ для моей паранойи — между ними есть что-то общее. Они все подписаны друг на друга. Ну как все, 11 аккаунтов. Давайте присмотримся повнимательнее.

Хабра-детектив на выходных - 4

Рис. 2. Взаимная подписка рассматриваемых аккаунтов с 2019-11-20 до 2019-11-23

То же самое GIF анимацией (186 KB)

Хабра-детектив на выходных - 5

Рис. S2. Взаимная подписка рассматриваемых аккаунтов с 2019-11-20 до 2019-11-23

Не подозрительно ли? Особенно если учесть, что подписок на другие аккаунты у них практически нет. Внимательный читатель может заметить, что кроме 11 пользователей, о которых я говорил ранее (и которые перечислены под следующим спойлером), в данных присутствует двенадцатый — Ramir23 — единственный кто написал оригинальный пост Создание простой кликер-игры с нуля. Что он здесь делает — отдельный вопрос.

Список подписантов

Табл. S1. Список подозрительных аккаунтов, сортированый по дате получения приглашения на Хабр

Аккаунт Карма (голосов) Посты / комментарии Регистрация Приглашение Дней до
Ramir23 4.7 (14) 1 / 2 20.09.2019 04.10.2019 14
gimops 8 (8) 1 / 0 11.10.2019 24.10.2019 13
yanaharchencko 6.2 (21) 1 / 4 30.10.2019 01.11.2019 2
ggar 3 (3) 1 / 0 28.10.2019 07.11.2019 10
Simple219 7 (10) 1 / 1 02.11.2019 12.11.2019 10
lianabatalova 3 (13) 1 / 0 05.11.2019 14.11.2019 9
borisname 4 (8) 1 / 0 01.10.2019 19.11.2019 49
evelina_n 0 (12) 1 / 0 19.11.2019 20.11.2019 1
Harhencko 6 (10) 1 / 0 10.11.2019 20.11.2019 10
Emil-8 1 (3)
8 (10)
0 / 0
1 / 1
17.11.2019 22.11.2019 5
bar_nat 2 (8) 1 / 0 08.11.2019 22.11.2019 14
nata_name 8 (8) 1 / 0 20.11.2019 22.11.2019 2

*Для пользователя Emil-8 представлены данные состоянием на 2019-11-23 и -24 в связи с публикацией нового поста.

Все аккаунты зарегистрированы начиная с 2019-09-20, а захабрены с 2019-10-04. Между регистрацией и публикацией проходило от 1 до 14 дней за исключением
borisname (49 дней).

Пока я собирался с мыслями и делал красивую схему подписок, аккаунт Emil-8 опубликовал новый перевод Как сделать ваш HTML отзывчивым, добавив одну строку кода на CSS от 2019-11-23 на абсолютно другую тему и уже не из песочницы. Ранее перевод другой версии этого же текста оригинального автора уже публиковался на Хабре Делаем адаптивный HTML, добавляя одну строку в CSS 2017-12-16.

Чем занимаются неподозрительные аккаунты?

Итак, оригиналы взяты с:

Из оригиналов 11 на английском, 1 — на немецком. 3 статьи написаны одним автором и ещё 2 другим, остальные — разными.

Поговорим о тематике, а в случае Хабра — о хабах. Итак, из 11 доступных для прочтения переводов в следующих хабах представлены:

Пользователи Хабра указали на неточности или ошибки перевода в 7 постах из 10 прокомментированых.

Кроме публикации по одному переводу с каждого из 11 аккаунтов, рассмотренные пользователи также добавляют посты друг друга в избранное — 24 раза (максимум 5 избранных на аккаунт).

Из 12 аккаунтов 5 подписаны на 26 разных компаний, представленных на Хабре — всего 45 подписок, 2 компании встречаются все 5 раз и ещё 3 по 3 раза.

Ещё кто-то?

До данного момента были упомянуты только аккаунты, которые встречались в подписках значительное количество раз. Есть ли там другие? Есть, трое. Двое read-only (регистрация 2019-11-09 и -22) и один полноценный (регистрация 2019-11-07, приглашение от НЛО 2019-11-17). Последний, вероятно, вышел из песочницы и скрыл пост позже, потому информации о посте на данный момент нет.

Хабра-детектив на выходных - 6

Рис. 3. Подписка рассматриваемых аккаунтов состоянием на 2019-11-24, дополненная аккаунтами со схожим поведением

Интересное наблюдение, Alsou17 сразу после регистрации добавил в подписки bar_nat и больше активности не проявлял (по состоянию на 2019-11-24). Подписки ays_aad и Mercerexy не менялись с момента начала наблюдения (последняя активность 2019-11-20 и -18 соответственно).

Часто ли можно увидеть подписки на свежезарегистрированный read-only аккаунт? Пожалуй, оставлю этот вопрос без ответа.

Вместо заключения

"Что ж делать с этой информацией?" спросите вы, дочитав до конца? Вопрос, несомненно, интересный.

С одной стороны, это лишь 11 аккаунтов (и ещё 3 не менее подозрительных), вклад которых в Хабр — "переводы by Google Translate". 6 из них получили карму выше 5 и могут повлиять на рейтинг чужих постов и карму аккаунтов.

С другой стороны, 6 из аккаунтов появились за последние несколько дней и будет ли продолжаться такое распространение взаимосвязанных "пользователей" не известно.

Но всё же, зачем они это делают?..

На этой неопределённой ноте в духе любого стандартного детективного фильма прямиком из кино я и закончу. Спасибо за внимание!

"Если вы параноик, это ещё не значит, что за вами не следят" Гарольд Финч

P.S. Если вы нашли опечатки или ошибки в тексте, пожалуйста, сообщите мне. Это можно сделать выделив часть текста и нажав "Ctrl + Enter", если у вас есть Ctrl, либо через личные сообщения. Если же оба варианта недоступны, напишите об ошибках в комментариях. Спасибо!

Автор: Yevhenii Vaskivskyi

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js