Рубрика «machine learning»

Как я собрал русскоязычного ИИ-рентгенолога: скрещиваем ViT и ruGPT-3 в условиях Kaggle

2026-03-20 в 10:15, admin, рубрики: computer vision, hugging face, machine learning, python, pytorch, искусственный интеллект

Привет!

Читать полностью »

Как я поймал Трансформер на читерстве: гроккинг, математика и Mechanistic Interpretability

2026-03-10 в 13:46, admin, рубрики: ai alignment, grokking, machine learning, pytorch, specification gaming, Transformers

Феномен Grokking и Mechanistic Interpretability — главные тренды в исследованиях лабораторий уровня OpenAI и Anthropic. Я решил потрогать эти концепции своими руками на уровне тензоров. Цель казалась тривиальной: заставить кастомный микро-Трансформер (всего 1М параметров) выучить базовую арифметику с нуля. Однако вместо математического гения я получил ленивого мошенника. Эта статья — инженерный детектив о том, как нейросети пытаются нас обмануть (Specification Gaming), и как вскрытие Attention-матриц помогает поймать их за руку.

Глава 1. Полигон и экстремальный Weight Decay

Читать полностью »

Сделка с совестью на хакатоне или «Как победить с нерабочим кодом?» История одной команды…

2026-02-28 в 13:09, admin, рубрики: data science, machine learning, Веб-разработка, госсектор, конкурсы, разработка по, управление проектами, хакатон, цифровая трансформация

ДИСКЛЕЙМЕР: Все изложенное является субъективным мнением автора, основанным на личном опыте участия. Все ссылки на код и сайты находятся в открытом доступе

Каждый из нас когда-то задумывался об участии в хакатоне. Романтика, код, энергетики и идея изменить мир к лучшему. Но далеко не каждый знает о «поднаготной» таких мероприятий, особенно когда заказчиками выступают государственные организации.

Эта история началась прошлой осенью, когда пятеро друзей решились выйти на поле боя ради идеи улучшить жизнь людей вокруг. Мы собрали команду, проанализировали доступные треки и остановили свой выбор на хакатоне Читать полностью »

Survival analysis, или предсказание смерти пациента

2026-02-25 в 5:15, admin, рубрики: classification, healthcare, machine learning, models, regression, survival analysis

«Да как ты смеешь! Что ты на себя берёшь?» — могут сказать некоторые из читателей.

И действительно, на первый взгляд идея разрабатывать модели, которые предсказывают, через сколько умрёт человек, звучит пугающе и даже аморально. Но если копнуть глубже, становится ясно: речь идёт не о «предсказании смерти» как факта, а о предсказании «риска смерти» на данный момент времени, что потенциально даёт возможность отслеживать этот риск и возможно даже управлять им.

Эта область называется Survival analysisЧитать полностью »

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

2026-01-23 в 7:16, admin, рубрики: bm25, embedding, machine learning, rag, retrieval, векторные базы данных, нейросети, поиск

Вы внедрили RAG в продакшен. Embedding-модель занимает топовые позиции на MTEB, векторная база настроена, chunking оптимизирован. Всё работает. Пока пользователи не начинают жаловаться: "Система не находит очевидные документы". Вы проверяете — документы есть, запросы адекватные. В чём дело?

Исследователи из Google DeepMind нашли ответ в статье "On the Theoretical Limitations of Embedding-Based Retrieval", и он неприятный. Оказывается, embedding-модели имеют фундаментальный математический потолок — и никакие данные, никакое обучение, никакой размер модели его не пробьют. Это не баг. Это геометрия.

Читать полностью »

Как 17-летний писал RAG-алгоритм для хакатона AI for Finance Hack: ретроспектива

2026-01-17 в 18:23, admin, рубрики: AI, ai engineering, data science, github, machine learning, python, rag, Райффайзенбанк, соревнование, хакатон

Привет! Мой путь в мире IT официально начался относительно недавно: в октябре 2025 года. До этого программирование вообще не выходило за рамки увлечений. Но однажды я решил испытать удачу и выйти на тропу приключений, после которой я уже не вернулся прежним...

Читать полностью »

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

2026-01-13 в 9:01, admin, рубрики: embeddings, machine learning, ml, nlp, ruvds_статьи, вектор, векторное представление, машинное обучение, эмбеддинги

Я уверен, вы видели модели машинного обучения, которые принимают текст и предсказывают, является ли он спамом. Аналогично модель может проанализировать отзыв о фильме и определить его тональность — положительную или отрицательную, понимать что «груша» связана с «яблоком» куда больше, чем с «теплоходом».

Первое правило обучения любой модели машинного обучения — это преобразование входных данных в числа. Любой цифровой объект можно представить как некое число: картинку, текст, аудио или видеофайл — практически всё что угодно.

Читать полностью »

AI для PHP-разработчиков: практика без Python и data science

2026-01-10 в 18:08, admin, рубрики: AI, backend, backend-программирование, backend-разработка, machine learning, machinelearning, ml, php, искусственный интеллект

Про AI сейчас пишут много, мягко говоря. Причём пишут буквально все, кому не лень. Но если вы PHP-разработчик, то, скорее всего, ощущение примерно такое: тема вроде бы важная, но почти всё – не для вас, а двигаться в эту сторону нужно, ибо... ну, вы и сами понимаете.

Большинство материалов сразу уезжают в Python, Jupyter, PyTorch, обучение моделей, математику и датасеты. Даже когда речь идёт не про data science, а про практику – примеры всё равно из другого мира.

Читать полностью »

Обучение эмбеддингов GitHub репозиториев

2026-01-05 в 19:16, admin, рубрики: embeddings, machine learning, wasm

TL;DR

Идея:Читать полностью »

ML-аналитика, какие проблемы решает, инструменты, зачем выделять ресурсы

2025-12-28 в 10:30, admin, рубрики: analytics, data science, machine learning, АБ-тесты, звук, метрики, модели, музыка, прогнозирование

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «machine learning»

Как я собрал русскоязычного ИИ-рентгенолога: скрещиваем ViT и ruGPT-3 в условиях Kaggle

Привет!

Как я поймал Трансформер на читерстве: гроккинг, математика и Mechanistic Interpretability

Глава 1. Полигон и экстремальный Weight Decay

Сделка с совестью на хакатоне или «Как победить с нерабочим кодом?» История одной команды…

Survival analysis, или предсказание смерти пациента

Почему ваш RAG не найдёт нужные документы: математический потолок embedding-моделей

Как 17-летний писал RAG-алгоритм для хакатона AI for Finance Hack: ретроспектива

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

AI для PHP-разработчиков: практика без Python и data science

Обучение эмбеддингов GitHub репозиториев

TL;DR

ML-аналитика, какие проблемы решает, инструменты, зачем выделять ресурсы