Хабра-детектив на выходных 2. Новый уровень

в 8:11, , рубрики: DIY, diy или сделай сам, habrbusters, визуализация данных, информационная безопасность, нет места анонимности, никто не читает теги, социальные сети, Социальные сети и сообщества, хабр, хабра-детектив, хабра-теория заговора

Хабра-детектив на выходных 2. Новый уровень - 1
Вы ведь помните историю про студентов? Ту самую, где за перевод технической статьи, опубликованный на Хабре, ставили зачёт. Я ведь знаю, что помните. Сам недавно видел комментарий к очередному переводу из песочницы: "Зачёт-то поставили?".

Поскольку уже прошел целый месяц с того самого, первого Хабра-детектива, я решил узнать, что же случилось с этими "подозрительными пользователями" и сколько ещё таких пришло на Хабр и опубликовало статью / перевод. А самое главное — кто эти студенты и откуда.

Итак, новое расследование и пища для ваших размышлений об отсутствии анонимности. А также, приятный бонус — старая Хабра-теория заговора в новых красках. Пока Boomburum ещё не опубликовал очередную AMA и список нововведений, на Хабре меняется favicon, а обсуждать толком нечего, добро пожаловать!

Важное замечание

В статье не будут опубликованы личные данные (да, вообще). Даже те, которые и так доступны в профилях упомянутых пользователей на Хабре — они вольны поменять информацию в любой момент. Это принципиальная позиция. При этом, я могу упоминать, что у кого-то совпадают имена.

В случае, если имя и / или фамилия уже содержится в логине пользователя, ответственность за публикацию этих данных лежит на пользователе, а не на Хабра-детективе.

Короткое напоминание

Как вы помните (а если не помните, то можете ещё раз перечитать в оригинальной публикации), всё началось 20.11.2019. Заметив подозрительно знакомую картинку в одном из свежих переводов, я начал искать, где же она была ранее. И всего за 4 дня мне удалось найти группу из 12 студентов, опубликовавших 11 переводов и 1 оригинальную статью на Хабре для получения зачёта в университете.

И хотя я не упоминал этого в публикации прямо, тема создания множественных аккаунтов и использования их для "тёмных дел" на Хабре всплыла в первом же комментарии. Естественно, Exosphere от имени модераторского отдела Хабра заверила, что такого нет и быть не может, и мы ей поверим.

Однако много вопросов осталось без ответов. К примеру, сколько же было студентов? Делали ли они ещё что-то на Хабре, кроме переводов-за-зачёт? Кто они и откуда? А также множество других.

Наследие Хабра-детектива

После моей публикации, под некоторыми новыми переводами из песочницы было упомянуто данное расследование. Если вам интересно, я сделал небольшой список на память.

Сколько было студентов?

Много. Нет, я вполне серьёзно. Буквально сейчас, просматривая профиль Exosphere, я увидел, что по состоянию на 27.11.2019 15:14 "На самом деле, вроде один остался". Но не тут-то было.

После этого комментария было захабрено ещё 11 очевидных студентов. "Почему очевидных" спросит читатель? Они сделали ровно то, что и все предыдущие — подписались друг на друга. Кроме того, ещё 8 таких же аккаунтов было одобрено, а публикации выпущены из песочницы, между датами публикации Хабра-детектива и комментария, приведённого выше.

Таким образом, вместе с новыми 19 аккаунтами и 13 оригинальными, всего их стало 32. Почему 13 оригинальных, а не 12? Дело в том, что Mercerexy уже был приглашен на сайт до прошлого расследования, однако его статья была скрыта. В результате, он рассматривался не как вероятный подозреваемый, а лишь как возможный. Поскольку 28.11.2019 он опубликовал ещё один пост, теперь он полноценный участник клуба.

Почему они решили продолжить славную "незаметную" традицию подписываться друг на друга? Может, они ждали ещё одного расследования? Вот и оно.

Как выглядит всеобщая круговая подписка?

Всего месяц назад взаимная подписка всех этих аккаунтов выглядела примерно, как на Рис. 1. Её даже можно было красиво визуализировать и использовать в качестве КДПВ.

Хабра-детектив на выходных 2. Новый уровень - 2

Рис. 1. Взаимосвязанные аккаунты (23.11.2019)

Всего через месяц всё стало намного хуже (Рис. 2). Всего 32 пользователя объединяет 151 подписка (около 4.7 подписок / подписчиков в среднем на аккаунт). И это лишь те, кто опубликовал статью. В прошлым раз на 12 пользователей приходилось 59 подписок (около 4.9 на аккаунт).

Хабра-детектив на выходных 2. Новый уровень - 3

Рис. 2. Взаимосвязанные аккаунты (21.12.2019)

Вы ведь заметили, они точно пытаются воссоздать канонический логотип Хабра своими подписками?

Уточню, приведены не все подозреваемые мной аккаунты, а лишь те, у которых есть публикация. Есть ещё несколько пользователей без публикаций и без приглашений на Хабр. Пока.

Личности или нет?

Итак, наши начальные данные вам известны. Сразу после публикации первого Хабра-детектива, Exosphere рассказала об интересе модераторов к этой группе пользователей и о том, что все они заходят на Хабр с IP адреса "одного из профильных гос. университетов России". Полная цитата приведена под спойлером.

Полная цитата

Нас тоже заинтересовала эта история и, разумеется, мы провели расследование, но гораздо примитивнее, чем ваше, по одной только причине — у нас есть IP всех этих пользователей. Общий, ага.

Но всё оказалось прозаично (и это уже не первый случай) — айпишник принадлежит одному из профильных гос. университетов России. То есть ребята получили задание сделать технические переводы для того, чтобы получить зачёт/экзамен. Есть инвайт — есть галка в зачётке, вероятно. А поскольку переводы довольно неплохие, и аудитория их приняла позитивно, почему не помочь хорошим ребятам? Будем надеется, что из них вырастут хабраавторы ну или хотя бы хорошие читатели :-)

Посмотрев профили некоторых из них можно увидеть город проживания и полные имена.

Список #1 (разогрев)

(difficulty: easy)

Начальный поиск занял у меня ровно 15 минут. Причём первые 13 из них я регистрировался в одной популярной свалке персональных данных социальной сети. В результате был определён университет и специальность. Ещё около 2 минут потребовалось для того, чтобы определить год поступления. У одного из пользователей был указан предполагаемый (2024) год окончания обучения (напомню, на дворе 2019 год, то есть учиться осталось 5 лет). Поскольку в университете обычно учатся от 4 до 6 лет в зависимости от получаемой квалификации, есть всего 2 варианта года поступления (студенты ведь учаться хорошо, пишут статьи на Хабр и на второй год точно не остаются).

Итак, наша цель — поступившие в профильный технический университет в 2018 или 2019 году. Ещё через 5 минут просматривания PDF с приказами о зачислении, был найден первый студент. Теперь мы знаем, что эта группа — студенты 2 курса специальности "Прикладная информатика". Список личностей #1 был составлен ещё через 10 минут. В нём небыло ничего сложного, т.к. почти у всех были пара имя-фамилия в профиле на Хабре, либо логин уже содержал хотя бы часть этих данных.

Итого, у нас есть 11 аккаунтов из 32 изображенных на Рис. 2. Кроме них есть ещё 2 аккаунта — OZI_returns и vladafedorova. Первые в нашем списке, не совершившие взаимоподписывания. У каждого по переводу, оба от 16.12.2019 — "5 скрытых cекретов в Java" и "Внесите эти изменения, чтобы соответствовать стандартам доступности веб-дизайна" соответственно. Всего 13 пользователей.

Список #2 (применим логику)

(difficulty: normal)

Но ведь это было слишком просто. Нужно найти и других. Иначе какой же это детектив. Ещё немного времени, проведённого в той же социальной сети, позволило определить teamin7, ays_aad, lavrkat1 и Alsou17. Кроме того, была найдена adelishaa — профиль, который не был замечен в круговой подписке.

Немного логики и список поступивших показали личности RenyaRakh и PechAn, а krymzhuzha выдала ещё и дата рождения. Несложно было найти и YuriyEfimov218. Он, кстати, тоже решил ни на кого не подписываться, как и AlTaaab. А вот gablena пока не публиковала переводов. У binenda есть и перевод, и подписка на один из других студенческих аккаунтов. Все они входят в список #2.

Итого, 25 студентов уже есть. Осталось всего немного, однако дальше будет не так просто. Продолжим.

Список #3 (немного настойчивости)

(difficulty: hard)

Хотя найти bar_nat в социальных сетях не сложно, найти его в списках поступивших заняло у меня несколько минут. Оказалось, он поступал на ту же специальность, но на другой факультет (не спрашивайте меня, почему, так в документах написано). А списки сделаны как обычно и поиск в них, естественно, не работает.

Профиль slaash1 найти проще простого. Однако, он не поступал одновременно со всеми остальными в 2018. Аналогичную пару имя-фамилия можно найти в списке поступивших в 2017 году на другую специальность — "Программная инженерия". Поскольку я не знаю, как устроена система высшего образования в России и можно ли менять специальности без перепоступления, просто запомним этот факт. Кстати, он есть в списках друзей у других студентов.

В том же году поступил albert_xal, но на стандартную для наших студентов специальность "Прикладная информатика".

Пользователя diamia выдала дата рождения, несмотря на то, что в социальной сети её имя не полностью соответствуют документам. Ну и, кроме того, она "дружит" с половиной списка студентов.

Пользователя M1R0NE можно найти в списке поступивших студентов по имени в профиле на Хабре, а проверить по множеству друзей в социальной сети из того же списка.

Список #3

Так мы плавно подошли к 30 студентам.

Список #4 (отдохнём)

(difficulty: easy)

Всё время до этого я искал пользователей Хабра в списках студентов и в социальной сети. Что можно найти, если искать в обратном направлении? Поскольку у нас есть список всех учащихся, мы можем поискать пользователей Хабра. Таких, кого я раньше не видел, нашлось 5. Их список как обычно под спойлером. Почему их не замечали раньше? Они ещё ничего не публиковали. Или, во всяком случае, модерация пока ничего не пропускала.

Список #4

Если вы всё ещё следите, то знаете, уже 35 пользователей.

Список #5 (по хлебным крошкам)

Если представить, что количество студентов фиксировано и я знаю всех из них, можно попробовать подобрать ещё несколько пар логин — личность. К примеру, свободное имя, как у Timka_Nevedimka осталось лишь одно. То же касается и sunshiny. При этом, оба — студенты, а не случайные пользователи Хабра. Это выдают подписки и личная информация в профилях.

Кстати, вы знали, что Хабр выдаёт пол пользователя? Ну, не совсем выдаёт, но если зайти на страницу подписчиков аккаунта, то можно увидеть "Его читают" / "Её читают". И если первое не говорит ничего о поле (он может быть просто не указан), то второе выдаёт девушку (либо того, кому нравится указывать женский пол в анкетах). К сожалению, эта функция выдаёт только sovesttut.

Обычно по глаголам можно определить, кто пишет. Но, к сожалению, все переводы не содержат ни одного оригинального предложения от авторов. Потому приходится использовать лишь комментарии (которых практически никто не пишет). Из оставшихся однозначных студентов можно определить пол Simple219 (М) и eva_1 (Ж).

Доходим до числа 40 студенческих аккаунтов на Хабре.

Список #6 (и снова новые студенты)

Что вы скажете, если написание переводов на Хабр стало настолько популярно, что смогло выйти за пределы одной группы? Быстрый поиск по пользователям из Уфы выдал 6 пользователей, подходящего возраста. И, внимание, они уже не со специальности "Прикладная информатика". Итак...

notikay учится на том же курсе по специальности "Информатика и вычислительная техника". А вот union77ns — на год старше и поступал вместе с slaash1 на программную инженерию. Оба пока не публиковались на Хабре.

Трое не оставили достаточно информации для своего поиска, а вот поиск последнего не дал результатов. Поскольку я не могу уверенно сказать, правда ли они студенты того же университета, о них умолчим.

Так-что всего 42 аккаунта.

Двойники

Остался вопрос по поводу yanaharchencko и Harhencko. В спиках студентов есть только один человек с такой фамилией (которая, к тому же, написана нестандартной транслитерацией). Однако, оба пользователя всё ещё активны на Хабре (заходят время от времени). Кстати, именно с них начался первый Хабра-детектив. Но вполне возможно, они просто родственники.

Кроме того, логин пользователя nyladnoprivet идентичный логину binenda в социальной сети. Принадлежат ли эти два аккаунта одному человеку — интересный вопрос.

Вопросы остаются и к albert_xal / albert_ramilevich, а также к EFAZ / bar_nat. Либо у вас есть двойники с идентичными именами-фамилиями, либо одно из двух. Аналогичные подозрения есть и касательно krymzhuzha / Krym75Ti.

Если же все эти аккаунты на самом деле независимы, получаем 47.

Кого я ещё не упоминал

Я назову лишь тех, в ком я уверен. Хотя и это ничего не гарантирует. Возможно, не все из них из одного университета. Итак, список:

Список тех, кто прячется лучше

В результате, наш подсчёт заканчивается на числе 56 студенческих аккаунтов, зарегистрированных на Хабре.

Если хотите проверить

Если вдруг вы один из студентов и уже знаете правильный ответ, попробуйте проверить полученный мной. Первые буквы имён / отчеств 39 человек (тех, для кого полностью определено ФИО, кроме двойников) встречаются в таком количестве:

Список первых букв

Имя Отчество
12х А 10x Р
В 7x А
Т 5x Д
Э 4x И
Г 3x В
Д 3x С
Р 2x Ю
Ю 1x Б
Я 1x З
Б 1x К
Е 1x П
К 1x Ш
Л
М
Н
С
Ш

(всего: 39)

Насчитались

Пришло время теория заговора и вывода карма-формулы.

Внимание! Презумпцию невиновности никто не отменял.
Никаких доказательств использования любого из перечисленных аккаунтов в злых, коварных, корыстных, неправомерных и любых других действиях нет. Всё, приведённое ниже — очередная теория заговора и она здесь исключительно в развлекательных целях.

Как я и обещал, не может быть продолжения Хабра-детектива без теории заговора. Она не нова и поднималась в прошлый раз. Могут ли множественные пользователи накручивать рейтинг и карму друг другу?

Ответ на первый вопрос — конечно же могут. Голосовать за публикации и комментарии могут все активные участники Хабра с кармой 5+. Потому, получить зачёт, для которого нужно было опубликовать заплюсованную статью, не очень сложно — можно ставить плюсы друг другу.

С кармой всё интереснее. Если два пользователя голосуют взаимно положительно за карму, то получают дробное её значение. Вероятно, вы замечали странные числа вроде (X).2 и т.д. Теперь будете знать, почему так случается.

Как думаете, студенты воспользовались этой возможностью? Посмотрим на карму всех перечисленных ранее пользователей. Как видно, голосовать на данный момент могут 27 аккаунтов. Карма ещё 16 сильно низка для этого, а 13 пока ничего не публиковали и инвайты не получили.

Много ли это, 27 аккаунтов? В принципе, этого почти достаточно для участия в ППА (нужно набрать 30+ рейтинг публикации для получения поощрения). Однако напоминаю вам, презумпцию невиновности никто не отменял. Прошу воздержаться от поспешных выводов.

Карма

Логин Карма Голосов
Stanisurav 11.2 12
slaash1 10.5 18
Eliska 10 16
Emil-8 10 24
gimops 10 20
sodomith 10 10
lavrkat1 9.2 16
Alsou17 9 9
PechAn 9 11
sovesttut 9 9
RenyaRakh 8.7 31
byriack 8.2 9
KRUGLIKYB 8.2 11
binenda 8 14
sunshiny 8 10
OZI_returns 7.2 10
vladafedorova 7.2 8
adelishaa 7 11
nata_name 7 13
eva_1 6.7 9
Krym75Ti 6.7 7
krymzhuzha 6 11
Simple219 6 19
teamin7 6 6
borisname 5.5 12
Mercerexy 5 7
YuriyEfimov218 5 5
xbeanzxcorex 4.7 9
BhHal 4.5 18
Harhencko 4.2 15
ays_aad 4 8
lianabatalova 4 18
Timka_Nevedimka 4 12
Ufenok 4 6
AlTaaab 3.5 21
A-P-T-E-M 3 13
bar_nat 3 13
ggar 3 5
JIMOHHUK 3 13
yanaharchencko 2.2 27
diamia 2 20
Ramir23 1.7 17
evelina_n -2 14
albert_ramilevich - -
albert_xal - -
casellow - -
EFAZ - -
g4merka - -
gablena - -
IronSwan666 - -
M1R0NE - -
milbai - -
notikay - -
nyladnoprivet - -
union77ns - -
vadiMUKH - -

Нас интересуют те, у кого карма дробная. Таких 17 и вы можете найти их в списке выше.

Простейшая комбинация, при которой можно получить результат (X).2 при количестве голосов (X+1) — получить 0.2 за один из голосов. Все остальные варианты ещё сложнее. Под такой вариант подходят Stanisurav (11.2 / 12), byriack (8.2 / 9) и vladafedorova (7.2 / 8). Интереснее ситуация у Krym75Ti (6.7 / 7) — он получил 0.7 от кого-то? Если такое возможно, то трое до этого могли получить по 0.7 и 0.5, что дало бы такой же результат, как наблюдаемый.

К сожалению, какие оценки поставлены, если количество голосов существенно больше суммарной оценки, определить невозможно. Вклад 0.2 / 0.7 очевидно заметен, но их входжение в результат 5 раз могут дать и не такие заметные (X).0 и (X).5 соответственно.

И вот тут момент на подумать самостоятельно. Сколько возможно вариантов расчёта кармы? Правильный ответ о том, как считается карма знает только Хабр (ну и Boomburum). Но вряд ли нам об этом скажут.

Небольшой бонус

Когда же студенты вспомнили о зачёте?

Все ведь знают, что люди откладывают дела на последний момент? Попробуйте угадать (Рис. 3), когда же студенты вспоминили о том, что для зачёта им нужно опубликоваться на Хабре, и пошли регистрироваться.

Хабра-детектив на выходных 2. Новый уровень - 4

Рис. 3. Когда студенты регистрировались

Именно так, 20 регистраций 10.12.2019. Кажется, это было "последнее напоминание" перед дедлайном.

Теперь они полноценные члены Хабра-сообщества?

Как сказала Exosphere в прошлый раз одному из студентов

С вас — тщательное чтение Хабра и использование местных материалов в учебных целях. А потом и полезный контент ;-)

Поскольку невозможно проверить, читают ли они что-то, посмотрим, заходят ли они хотя бы на Хабр. На Рис. 4 показана последняя активность пользователей. Интересно, нарастающая интенсивность посещений 2, 9 и 16 декабря — это дни пар раз в неделю?

Хабра-детектив на выходных 2. Новый уровень - 5

Рис. 4. Когда студенты заходили на Хабр последний раз (по состоянию на 9:00 UTC 26.12.2019

Надо сказать, это оптимистично, что все они были активны в этом месяце. При этом те, кто написал статьи раньше, меньше заходили во второй половине декабря. И наоборот. Сессия — она такая.

Вместо заключения

Время очередного вопроса "Что же делать?" Как обычно, однозначного ответа не будет.

Если в прошлый раз я говорил, что это лишь 12 аккаунтов с Google-translate переводами, то в этот раз их уже слегка побольше. Думаете, будет ли подобная практика зачётов за публикацию распространятся далее? Поговаривают, это уже не первый наплыв зачётов на Хабр.

Возможно, вот вам идея для нового Хабра-ресурса, студенческое крыло? Boomburum ведь спрашивал об идеях.

Если быть серьёзным, то не стоит относится строго к студенческим публикациям на Хабре. Как бы вам, мне или администрации не хотелось, контент Хабра содержит множество тематик, а степень качества публикаций варьируется в пределах (-∞; +∞). Часто публикации новичков ничем не уступают заядлым Хабра-авторам, а иногда старички публикуют какую-нибудь ерунду. Будьте справедливы.

Кстати, вам не показалось, что плетут студенты, не заговор, а лишь Хабра-комок? Возможно.

Хабра-детектив на выходных 2. Новый уровень - 6

Шутки шутками, но время заканчивать нашу рождественскую детективную историю. Помните, всё, что когда-то попало в интернет, останется в интернете. Даже если вы этого не хотите.

Спасибо за внимание!

"Если вы параноик, это ещё не значит, что за вами не следят" Гарольд Финч

P.S. Если вы нашли опечатки или ошибки в тексте, пожалуйста, сообщите мне. Это можно сделать выделив часть текста и нажав "Ctrl / ⌘ + Enter", если у вас есть Ctrl / ⌘, либо через личные сообщения. Если же оба варианта недоступны, напишите об ошибках в комментариях. Спасибо!

P.P.S. Возможно, вам будут интересны также другие мои исследования Хабра или вы хотите предложить свою тему для следующей публикации, а может даже новый цикл публикаций.

Где найти список и как внести предложение

Всю информацию можно найти в специальном репозитории Хабра-детектива. Там же можно узнать, какие предложения уже были озвучены, а что уже находится в работе.

Кроме того, вы можете упомянуть меня (написав VaskivskyiYe) в комментариях к публикации, которая кажется вам интересной для исследования или анализа. Спасибо Lolohaev за эту идею.

Автор: Yevhenii Vaskivskyi

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js