Рубрика «анализ данных»
Компрессор для данных или как я написал свой первый custom transformer
2026-01-25 в 11:16, admin, рубрики: compression, custom transformer, data science, outliner, preprocessing, sklearn, transformer, анализ данных, выбросы
Индекс Шивы: словесный винегрет на 1000 рублей. Встряхнем «рынок лимонов»?
2026-01-22 в 17:56, admin, рубрики: hr-tech, анализ вакансий, анализ данных, зарплаты в it, Индекс Шивы, поиск работы, рынок труда, статистика, токсичностьКажется очевидным, что на рынке должен существовать показатель, связывающий длину вакансии и зарплату. Мне казалось, это настолько базовая идея, что я сильно удивилась, обнаружив, что подобного индекса раньше не было. Впрочем, к концу статьи вы отчасти поймёте почему.
Данный материал опирается на методологию и логику, описанную в предыдущей статье. Философского введения не будет — сразу к делу.
Данные
Объектом анализа стали 48 586 вакансий, агрегированных с HeadHunter и Habr Career. Подробнее о датасете можно прочитать здесь.
Прогнозирование выручки через Retention, ARPU и LTV
2026-01-17 в 15:22, admin, рубрики: arpu, forecasting, lifetime value, ltv, ltv-анализ, retention, анализ данных, доходность клиента, пожизненная ценность клиента, прогнозирование продажДля любых компаний, создающих различного рода продукты, важными составляющими является аналитика и оценка того, как продукт развивается, как влиять на его развитие, управлять и отслеживать положительные и негативные изменения.
Быстрота изменений UX/UI дизайна, функциональности, влияния запусков конкурентов, предоставляющих аналогичный продукт, внешние факторы – все это отражается на метриках удержания и сроке пользования продуктом, а значит и на тех деньгах, которые продукт зарабатывает по P&L.
Рынок лимонов и «размалеванные барышни»: текст вакансии как честное зеркало компании (датасет 146 000 вакансий)
2026-01-17 в 10:21, admin, рубрики: data science, hr-tech, nlp, анализ вакансий, анализ данных, выгорание, карьера, корпоративная культура, поиск работы, рынок трудаРынок лимонов и барышни в мишуре
Современный найм болен экстремальным дисбалансом данных. У соискателя на руках только описания вакансий и надежда на лучшее, а у работодателя — служба безопасности, полиграф, ATS-системы и психологические тесты. Асимметрия чудовищная.
Фактически, это реализация экономической модели «Рынка лимонов» Джорджа Акерлофа в масштабе целой страны. Покупатель (соискатель) не может оценить качество товара (вакансии) до подписания оффера. Из-за этого рынок заполняется «лимонами» — предложениями, не отражающими действительность. Может, это будет "не так плохо", но точно не то.
Построение иерархии классов для множества объектов информационной модели
2026-01-04 в 10:16, admin, рубрики: UML, анализ данных, Анализ и проектирование систем, иерархические данные, кластеризация, наследованиеПривет!
Почему мультиагентные системы плохо работают на малых данных
2025-12-25 в 11:37, admin, рубрики: BI, code execution, grok, python, xai, агенты ии, анализ данных, архитектура, дашборд, искуственный интеллектМультиагентные системы - главный тренд в AI-разработке. AutoGPT, CrewAI, LangGraph, Microsoft AutoGen обещают армию специализированных агентов, которые вместе решат любую задачу.
Сделал систему на 5 агентов, а потом передумал и сделал на одного.
История о том, что иногда с ИИ надо упрощать, а не усложнять.
Что делал
Сервис для автоматической генерации дашбордов из данных. Пользователь загружает файл (CSV, Excel, JSON, PDF), AI анализирует данные и создаёт интерактивный дашборд с графиками. Бесплатный, без регистрации.
За пару недель работы:
-
153 дашборда сгенерировано
-
93 уникальных пользователя
-
Среди них крупные FMCG-сетиЧитать полностью »
Что посмотреть на новогодних каникулах: 11 фильмов и 1 сериал про анализ данных и математику
2025-12-25 в 7:06, admin, рубрики: анализ данных, подборка фильмов, фильмы для аналитика, что посмотретьВсем привет! При свете дня я — Ольга Матушевич, преподаватель онлайн-магистратуры в Яндекс Практикуме, а во тьме ночной — просто Оля, которая хочет посмотреть интересную киношку. И хотя в такие моменты хочется отдыхать, профдеформация порой не отпускает: рука сама тянется выбрать что-нибудь про цифры, статистику, вероятности и прочие радости аналитики.
Аналитическая инфраструктура для сбора и исследования данных Steam: архитектура, пайплайны, результаты
2025-12-23 в 13:16, admin, рубрики: big data, Steam, Steam Web API, анализ данныхSteam — одна из крупнейших платформ цифровой дистрибуции игр, и одновременно огромный источник данных: каталоги игр, отзывы, достижения, ценовые метрики, активность игроков, региональные различия и многое другое. Однако прямого доступа к агрегированным данным у исследователей нет — их необходимо собирать вручную через Steam Web API и сторонние сервисы.
В этом проекте мы разработали полноценный программный комплекс для автоматизированного сбора, хранения и анализа данных SteamЧитать полностью »
Анализ 400k вакансий hh.ru: как мы строили пайплайн и какие тренды нашли
2025-12-21 в 18:16, admin, рубрики: api, data science, hh.ru, python, sqlite, анализ данных, базы данных, визуализация данных, проектирование системВсем привет!
Сегодня я расскажу, как наша студенческая команда из СПбПУ разработала систему для сбора и анализа данных о российском IT-рынке труда с помощью платформы hh.ru. Вместо громоздкого монолита мы построили модульное асинхронное приложение на Python, сфокусировавшись на высокой производительности при массовом сборе данных, устойчивости к ошибкам и построении чёткого аналитического конвейера.
Почему аналитика не даёт измеримого бизнес-результата?
2025-12-20 в 6:16, admin, рубрики: data-driven, анализ данных, аналитика, Управление компаниейЗа десять лет практики в аналитике я часто сталкивался с ситуацией, когда аналитическая функция не даёт измеримого бизнес-результата. При этом от неё обычно ждут инсайтов, которые дают иксы прироста — иногда даже сами по себе, без внедрения.
Проблема неприятная и распространённая. Она решается не просто и не быстро, но для построения устойчивого бизнеса в конкурентной среде решить её всё-таки придётся.
