Рубрика «статистика» - 2

1. Игры с нулевой отметкой (Truncated Y-Axis)

Это самый старый и эффективный трюк в книге «Как лгать при помощи статистики». Если вам нужно создать драму на ровном месте или превратить стагнацию в «невероятный рывок» — просто отрежьте нижнюю часть графика.

Механика обмана
В нормальном состоянии ось Y (вертикальная шкала) должна начинаться с нуля. Это дает нам точку отсчета. Манипулятор же начинает отсчет не с 0, а с числа, которое вплотную приближено к значениям данных. Например, если ваши показатели колеблются между 90 и 95, вы начинаете шкалу с 89.

Почему наш мозг на это покупается?
Читать полностью »

Привет! В каждой компании есть люди, которые не пишут код каждый день, но почти каждый день принимают решения, от которых этот код либо спокойно живёт под нагрузкой, либо превращается в источник инцидентов и срочных созвонов. Думаю они согласятся, что масштабируемые IT-продукты строятся не только на технологиях, а ещё и на умении мыслить вероятностно.

Когда в команде спорят о фичах, производительности или надёжности, я редко слышу принципиально разные аргументы. Чаще это разные формы одного и того же:

-Мне кажется, пользователям понравится.
-Я уверен, что система выдержит.
-Читать полностью »

Это небольшая статья не ставит себе целью подробно и математически строго изложить все подробности. Не будет она и практическим описанием алгоритмической стороны дела, так как статьи об этом пребывают в интернете в огромном количестве и без моей помощи. Это скорее попытка подсветить основные недоразумения и оградить от самых распространенных ошибокЧитать полностью »

Стек: Python, Airflow, ClickHouse, Slack

В iGaming падение активности игровых провайдеров почти никогда не выглядит как "обрыв". Чаще это медленное затухание: ставок становится меньше, затем еще меньше, игроки уходят постепенно. Формально провайдер продолжает работать, стандартный мониторинг молчит, а бизнес уже теряет деньги.

Моя задача была не фиксировать факт полного падения активности, а поймать момент, когда траектория уже направлена вниз, но ситуацию ещё можно развернуть.

Читать полностью »

Когда мониторинг эксперимента начинает искажать выводы

AB-тест почти всегда живет в плотном контуре принятия решений. Руководителю нужно понимать, не проседают ли ключевые показатели. Команде важно вовремя остановить вариант, который ухудшает метрику, и так же вовремя зафиксировать улучшение, если оно убедительное. Поэтому интерес к проверкам по ходу эксперимента естественен: данные копятся, отчеты обновляются, вопросы возникают каждый день.

Читать полностью »

Кажется очевидным, что на рынке должен существовать показатель, связывающий длину вакансии и зарплату. Мне казалось, это настолько базовая идея, что я сильно удивилась, обнаружив, что подобного индекса раньше не было. Впрочем, к концу статьи вы отчасти поймёте почему.

Данный материал опирается на методологию и логику, описанную в предыдущей статье. Философского введения не будет — сразу к делу.

Данные

Объектом анализа стали 48 586 вакансий, агрегированных с HeadHunter и Habr Career. Подробнее о датасете можно прочитать здесь.

Читать полностью »

Разбираю академические исследования о результатах дейтрейдеров, считаю реальные издержки на MOEX и объясняю, почему красивый бэктест – это ещё не стратегия. Спойлер: математика против вас, но это не приговор.


Двенадцать лет пишу на C++. Примерно столько же времени инвестирую. CAD-системы, редакторы документов, архитектура – это моя среда. В какой-то момент код и рынок пересеклись, и я полез разбираться в алготрейдинге не как в «способе быстро заработать», а как в инженерной задаче с десятком неожиданных подводных камней.

Читать полностью »

Все мы видели круговые диаграммы. Их любят рисовать во всяких отчётах и презентациях. А ещё их очень любят авторы рекламных материалов и стоковых картинок: довольный «эффективный менеджер» с лучезарной улыбкой держит в руках распечатку графиков своего головокружительного успеха.

Круговая диаграмма показывает процентное распределение каких-то величин. Весь круг целиком — это 100%. Каждый сектор круга соответствует определённой доле от общего целого.

Всё это очень похоже на нарезанный пирог, поэтому по-английски такие диаграммы аппетитно называются pie chart.

Ммм... пирооог…
— Гомер Симпсон

Читать полностью »

Представьте классическую ситуацию. Вы — аналитик. Вы только что провели A/B-тест или оценили средний чек. Ваш скрипт на Python выдал результат:

95% Confidence Interval: [100, 120].

Вы приходите к продакт-менеджеру и уверенно говорите:

С вероятностью 95% истинный средний чек находится между 100 и 120 рублями.

Менеджер доволен, вы довольны. Все звучит логично. Но у меня для вас новости. В этом утверждении вы допустили фундаментальную ошибку.

Если бы в комнате сидел настоящий математик, он бы начал кричать:

Нет там никакой вероятности! Параметр либо там, либо нет!.

Читать полностью »

Привет!

Слово «эйджизм» всё чаще мелькает в обсуждениях на профессиональных площадках. Но для кого-то это абстрактное понятие, а для кого-то суровая реальность поиска работы. Я решил не просто поговорить об этом, а проверить на практике, насколько сложно «возрастному» джуну пробиться в IT, в сравнении с его молодым коллегой.

Эта статья - не просто сборник статистики, а личный эксперимент, результаты которого покажут реальное отношение к эйджизму на рынке.


Эйджизм в цифрах

Давайте начнем с того, что говорит официальная статистика и какие страхи живут в головах работодателей.


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js