Совсем недавно в публичный доступ попали базы паролей популярных почтовых сервисов [1,2,3] и сегодня мы их проанализируем и ответим на ряд вопросов о качестве паролей и возможном источнике (или источниках). Так же мы обсудим метрики качества отдельных паролей и всей выборки.
Не менее интересными являются некоторые аномалии и закономерности баз паролей, возможно, они смогут пролить свет на то, что могло служить источником данных и насколько данная выборка является опасной с точки зрения обычного пользователя.
Формально, мы рассмотрим следующие вопросы: насколько надежными являются пароли в базе и могли ли они быть собраны словарной атакой? Есть ли признаки фишинговых атак? Могла ли «утечка» данных быть единственным источником данных? Могла ли данная база быть аккумулирована в течении длительного периода или данные исключительно «свежие»?
Структура статьи:




![Python digest #35. Новости, интересные проекты, статьи и интервью [27 июля 2014 — 03 августа 2014] Python digest #35. Новости, интересные проекты, статьи и интервью [27 июля 2014 — 03 августа 2014]](https://www.pvsm.ru/images/2014/09/15/Python-digest-35-novosti-interesnye-proekty-stati-i-intervyu-27-iyulya-2014-03-avgusta-2014.jpg)