Рубрика «machine learning» - 2

Сделка с совестью на хакатоне или «Как победить с нерабочим кодом?» История одной команды…

2026-02-28 в 13:09, admin, рубрики: data science, machine learning, Веб-разработка, госсектор, конкурсы, разработка по, управление проектами, хакатон, цифровая трансформация

ДИСКЛЕЙМЕР: Все изложенное является субъективным мнением автора, основанным на личном опыте участия. Все ссылки на код и сайты находятся в открытом доступе

Каждый из нас когда-то задумывался об участии в хакатоне. Романтика, код, энергетики и идея изменить мир к лучшему. Но далеко не каждый знает о «поднаготной» таких мероприятий, особенно когда заказчиками выступают государственные организации.

Эта история началась прошлой осенью, когда пятеро друзей решились выйти на поле боя ради идеи улучшить жизнь людей вокруг. Мы собрали команду, проанализировали доступные треки и остановили свой выбор на хакатоне Читать полностью »

Survival analysis, или предсказание смерти пациента

2026-02-25 в 5:15, admin, рубрики: classification, healthcare, machine learning, models, regression, survival analysis

«Да как ты смеешь! Что ты на себя берёшь?» — могут сказать некоторые из читателей.

И действительно, на первый взгляд идея разрабатывать модели, которые предсказывают, через сколько умрёт человек, звучит пугающе и даже аморально. Но если копнуть глубже, становится ясно: речь идёт не о «предсказании смерти» как факта, а о предсказании «риска смерти» на данный момент времени, что потенциально даёт возможность отслеживать этот риск и возможно даже управлять им.

Эта область называется Survival analysisЧитать полностью »

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

2026-01-23 в 7:16, admin, рубрики: bm25, embedding, machine learning, rag, retrieval, векторные базы данных, нейросети, поиск

Вы внедрили RAG в продакшен. Embedding-модель занимает топовые позиции на MTEB, векторная база настроена, chunking оптимизирован. Всё работает. Пока пользователи не начинают жаловаться: "Система не находит очевидные документы". Вы проверяете — документы есть, запросы адекватные. В чём дело?

Исследователи из Google DeepMind нашли ответ в статье "On the Theoretical Limitations of Embedding-Based Retrieval", и он неприятный. Оказывается, embedding-модели имеют фундаментальный математический потолок — и никакие данные, никакое обучение, никакой размер модели его не пробьют. Это не баг. Это геометрия.

Читать полностью »

Как 17-летний писал RAG-алгоритм для хакатона AI for Finance Hack: ретроспектива

2026-01-17 в 18:23, admin, рубрики: AI, ai engineering, data science, github, machine learning, python, rag, Райффайзенбанк, соревнование, хакатон

Привет! Мой путь в мире IT официально начался относительно недавно: в октябре 2025 года. До этого программирование вообще не выходило за рамки увлечений. Но однажды я решил испытать удачу и выйти на тропу приключений, после которой я уже не вернулся прежним...

Читать полностью »

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

2026-01-13 в 9:01, admin, рубрики: embeddings, machine learning, ml, nlp, ruvds_статьи, вектор, векторное представление, машинное обучение, эмбеддинги

Я уверен, вы видели модели машинного обучения, которые принимают текст и предсказывают, является ли он спамом. Аналогично модель может проанализировать отзыв о фильме и определить его тональность — положительную или отрицательную, понимать что «груша» связана с «яблоком» куда больше, чем с «теплоходом».

Первое правило обучения любой модели машинного обучения — это преобразование входных данных в числа. Любой цифровой объект можно представить как некое число: картинку, текст, аудио или видеофайл — практически всё что угодно.

Читать полностью »

AI для PHP-разработчиков: практика без Python и data science

2026-01-10 в 18:08, admin, рубрики: AI, backend, backend-программирование, backend-разработка, machine learning, machinelearning, ml, php, искусственный интеллект

Про AI сейчас пишут много, мягко говоря. Причём пишут буквально все, кому не лень. Но если вы PHP-разработчик, то, скорее всего, ощущение примерно такое: тема вроде бы важная, но почти всё – не для вас, а двигаться в эту сторону нужно, ибо... ну, вы и сами понимаете.

Большинство материалов сразу уезжают в Python, Jupyter, PyTorch, обучение моделей, математику и датасеты. Даже когда речь идёт не про data science, а про практику – примеры всё равно из другого мира.

Читать полностью »

Обучение эмбеддингов GitHub репозиториев

2026-01-05 в 19:16, admin, рубрики: embeddings, machine learning, wasm

TL;DR

Идея:Читать полностью »

ML-аналитика, какие проблемы решает, инструменты, зачем выделять ресурсы

2025-12-28 в 10:30, admin, рубрики: analytics, data science, machine learning, АБ-тесты, звук, метрики, модели, музыка, прогнозирование

Читать полностью »

Как я за год переквалифицировался в ИИ-инженера: от DevOps до production-ready AI-агентов

2025-12-22 в 19:51, admin, рубрики: ai engineering, machine learning, mcp-server, python, искусственный интеллект, сезон ии в разработке

КДПВ: Схема эволюции: DevOps → Python разработчик → AI Engineer с примерами проектов на каждом этапе. Альтернатива: скриншот дашборда с метриками AI-агентов в production.

Год назад я был типичным DevOps-инженером: настраивал CI/CD, деплоил микросервисы, оптимизировал инфраструктуру. Сегодня я строю AI-агентов для автоматизации бизнес-процессов, и мои клиенты экономят сотни часов в месяц.

Читать полностью »

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей

2025-12-09 в 21:25, admin, рубрики: data science, exploratory data analysis, feature engineering, machine learning, numpy, pandas, sklearn, statistics

Мы частенько шутим с коллегами , что любые действия можно поделить на «обезьяньи» и «smart»Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «machine learning» - 2

Сделка с совестью на хакатоне или «Как победить с нерабочим кодом?» История одной команды…

Survival analysis, или предсказание смерти пациента

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

Как 17-летний писал RAG-алгоритм для хакатона AI for Finance Hack: ретроспектива

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

AI для PHP-разработчиков: практика без Python и data science

Обучение эмбеддингов GitHub репозиториев

TL;DR

ML-аналитика, какие проблемы решает, инструменты, зачем выделять ресурсы

Как я за год переквалифицировался в ИИ-инженера: от DevOps до production-ready AI-агентов

От «обезьяньей» работы к Smart-анализу: как выполнить предобработку данных для моделей