Рубрика «машинное обучение» - 4

3 проблемы двусторонних маркетплейсов, которые мы до сих пор не можем решить

2026-01-16 в 13:41, admin, рубрики: двусторонний маркетплейс, искусственный интеллект, машинное обучение, проектирование, сезон ии в разработке

Когда читаешь о том, как работают с ML в крупных компаниях, всё выглядит логично: разбили пользователей на кластеры, провели A/B-тест, модель показала +5% к метрике — понесли в продакшен.

Читать полностью »

Разметка данных: самая дорогая часть машинного обучения

2026-01-16 в 13:35, admin, рубрики: active learning, AI, data science, dataset, quality assurance, Weak Supervision, ИИ, машинное обучение, нейросеть, разметка данных

Доброго времени суток, «Хабр»!

В предыдущей своей статье я рассматривал различные функции потерь - важную часть машинного обучения. Но даже такие функции совершенно беспомощны перед лицом беспорядка. Сегодня мы рассмотрим то, что предшествует любой тренировке - разметку данных.

Как и в предыдущей статье, приведу простенькое сравнение. Если модель - ученик, то разметка данных своего рода учебник, по которому она занимается. При этом создание такого учебника часто оказывается самым трудоемким, медленным и дорогостоящим этапом всего цикла ML-проекта.

Читать полностью »

Хакатон Норникеля: как мы выжали максимум из YOLO и заняли 2 место

2026-01-16 в 6:33, admin, рубрики: кейс, Компьютерное зрение, машинное обучение, сезон ии в разработке, хакатон, эволюционные алгоритмы

Привет! Пару лет назад мы с коллегами из Центра искусственного интеллекта СФУ искали способы набраться практического опыта в задачах компьютерного зрения. Одним из таких форматов оказались хакатоны — соревнования по решению ML-задач на реальных кейсах с жесткими дедлайнами.

За эти пару лет мы успели поучаствовать примерно в десяти хакатонах (Цифровой прорыв, Атомик Хак) и в половине из них доходили до призовых мест Читать полностью »

Функция потерь: как алгоритм понимает, что он ошибся

2026-01-13 в 13:00, admin, рубрики: BCE, Categorical Cross-entropy, Contrasitive Loss, Focal Loss, Huber Loss, MAE, triplet loss, машинное обучение, функция потерь

Доброго времени суток, «Хабр»!

Представьте, что вы играете в дартс. Сначала ваши дротики разлетаются по всей мишени, но с каждой попыткой вы постепенно приближаетесь к заветному центру. Человек интуитивно понимает, что нужно скорректировать бросок: сильнее, выше, левее или правее. Примерно так же работает и алгоритм машинного обучения. Только вместо интуиции там есть функция потерь.

Сегодня поговорим об этой функции, попробуем в ней разобраться и понять, как же алгоритм понимает, что он ошибся. Принимайте стратегически удобное положение, ну а я приступаю к своему повествованию.

Читать полностью »

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

2026-01-13 в 9:01, admin, рубрики: embeddings, machine learning, ml, nlp, ruvds_статьи, вектор, векторное представление, машинное обучение, эмбеддинги

Я уверен, вы видели модели машинного обучения, которые принимают текст и предсказывают, является ли он спамом. Аналогично модель может проанализировать отзыв о фильме и определить его тональность — положительную или отрицательную, понимать что «груша» связана с «яблоком» куда больше, чем с «теплоходом».

Первое правило обучения любой модели машинного обучения — это преобразование входных данных в числа. Любой цифровой объект можно представить как некое число: картинку, текст, аудио или видеофайл — практически всё что угодно.

Читать полностью »

Обучение ИИ-моделей на обычном ЦП

2026-01-09 в 20:51, admin, рубрики: cpu, gpu, pytorch, машинное обучение, оптимизация

Ещё раз о ЦП для машинного обучения в эпоху дефицита мощностей GPU

Читать полностью »

AI-безопасность: зачем нужен слой на C рядом с Python-детекторами

2026-01-04 в 16:12, admin, рубрики: AI, C, llm, opensource, prompt injection, security, машинное обучение

AI Security Gold Rush

Сейчас каждый делает решения для безопасности AI.

Последний год я анализировал разные решения и вот к какому выводу я пришёл:

Они все поразительно похожи:

Написаны на Python
ML-классификаторы для детекции
REST API обёртка
50-200мс задержка
Десятки зависимостей
Облачный деплой

И вот неудобная правда:

Они сами становятся векторами атак.

Ирония Python-решений для безопасности

Когда ваш слой безопасности:

Имеет 50+ зависимостей (каждая — потенциальная CVE)
Добавляет 50-200мс к каждому запросу (приглашение для DDoS)

Читать полностью »

Нейрометеум: наша новая нейросеть глобального прогноза погоды и её вклад в модель прогноза осадков

2025-12-26 в 13:00, admin, рубрики: машинное обучение, погода, прогноз погоды

Читать полностью »

От Шеннона до современного ИИ: применение теории информации в машинном обучении

2025-12-22 в 16:10, admin, рубрики: искусственный интеллект, машинное обучение, теория информации

Главная задача этой статьи — показать связь между теорией информации Шеннона и инструментами, которые можно встретить в современных системах машинного обучения. Здесь мы поговорим об энтропии (entropy) и о приросте информации (information gain), потом перейдём к кросс-энтропии (перекрёстная энтропия, cross-entropy), к KL-дивергенции (дивергенция или расхождение Кульбака–Лейблера, относительная энтропия, KL-divergence), рассмотрим методы, используемые в современных системах генеративного ИИ.

Читать полностью »

Нейросеть, которая не двигает стоп-лосс в 3 часа ночи. Мои эксперименты с алготрейдингом

2025-12-21 в 15:58, admin, рубрики: deepseek, llm, python, алготрейдинг, Криптовалюты, машинное обучение, трейдинг

Всё началось со знаменитого челленджа - соревнования, где разработчики пытаются создать прибыльного AI-трейдера. Идея засела в голове: а что если LLM действительно может торговать лучше человека? Без эмоций, без FOMO, без revenge trading в три часа ночи. Я решил проверить. И вот к чему это привело.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «машинное обучение» - 4

3 проблемы двусторонних маркетплейсов, которые мы до сих пор не можем решить

Разметка данных: самая дорогая часть машинного обучения

Хакатон Норникеля: как мы выжали максимум из YOLO и заняли 2 место

Функция потерь: как алгоритм понимает, что он ошибся

«Привет! Я [0.44, -0.91, 0.66…]» или как научить машину понимать смысл слов

Обучение ИИ-моделей на обычном ЦП

AI-безопасность: зачем нужен слой на C рядом с Python-детекторами

AI Security Gold Rush

Ирония Python-решений для безопасности

Нейрометеум: наша новая нейросеть глобального прогноза погоды и её вклад в модель прогноза осадков

От Шеннона до современного ИИ: применение теории информации в машинном обучении

Нейросеть, которая не двигает стоп-лосс в 3 часа ночи. Мои эксперименты с алготрейдингом