Рубрика «машинное обучение»

Какой минимум симптомов нужен врачу для постановки диагноза: теория грубых множеств вместо интуиции

2026-04-14 в 13:55, admin, рубрики: engee, бинарная матрица, вектор значимости, грубые множества, машинное обучение, медицинская диагностика, отбор признаков, редукты, теория Павлака

Введение
Немного истории: Павлак и грубые множества
Ключевые понятия: что такое редукт?
Постановка задачи
Алгоритм: как это работает?
Реализация в Engee
Результат и интерпретация
Заключение

Введение

Читать полностью »

Смогут ли микроконтроллеры с NPU заменить облако для распознавания речи?

2026-04-11 в 20:48, admin, рубрики: edge ai, mcu, npu, stm32, stm32n6, tinyml, машинное обучение, микроконтроллеры, нейросети, распознавание речи

Если вы пользуетесь голосовыми ассистентами — Алисой, Siri, Google Assistant — ваш голос каждый раз отправляется в облако. Там он распознаётся, и ответ приходит обратно. Работает неплохо, но нужен интернет, есть задержка, и по сути вы передаёте свой голос на чужие серверы. А что на самом устройстве? Здесь пока всё скромно: либо дешёвые чипы, которые знают десяток заученных команд типа «включи свет», либо мощные процессоры, которые быстро расходуют батарею и не подходят для компактных устройств.

Читать полностью »

Парадокс ансамблей: почему «слабые» модели иногда побеждают «сильные»

2026-04-11 в 15:16, admin, рубрики: ансамбли, временные ряды, машинное обучение, прогнозирование

TL;DR: В ансамблевом прогнозировании важнее не индивидуальное качество моделей, а разнообразие их ошибок. Эксперимент показывает: пул из «худших» по отдельности моделей даёт лучшую точность ансамбля, чем пул из «лучших».

Недавно я провёл эксперимент, который противоречит интуиции большинства практиков: пул из индивидуально более слабых моделей стабильно превосходит пул из более качественных моделей при объединении в ансамбль.

🔬 Методология эксперимента

Данные: финансовые временные ряды цены на пшеницу FOB Черное море, фундаментальные и макро факторы
Читать полностью »

KV-Cache в LLM: разбираем инференс через 9 ключевых вопросов

2026-04-10 в 11:21, admin, рубрики: attention, gpu, kv-cache, llm, prefix caching, prompt caching, Transformers, vllm, машинное обучение, машинное обучение. нейросети

Не так давно лимиты на использование Claude Code резко уменьшились, и люди стали лучше считать свои токены. Я не стал исключением, поэтому первым делом собрал информацию по использованию токенов в своих сессиях и посмотрел, что и сколько бы стоило, если бы отправлял это через API.

Claude Code Session Usage — Читать полностью »

Краткий справочник про внимания (self-attention, cross-attention, multi-head attention)

2026-04-08 в 4:15, admin, рубрики: attention, beginner, pytorch, self-attention, transformer, внимание, глубокое обучение, искуственный интелект, математика, машинное обучение

Механизм внимания (Attention) - это метод в искусственном интеллекте, который позволяет нейросети динамически определять, какие части входных данных наиболее важны для текущей задачи. Он работает через вычисление весов важности для разных элементов входа: более важные элементы получают больший вес, а менее важные - меньший. Затем модель формирует взвешенную сумму представлений, создавая новый контекстный вектор.

Читать полностью »

Почему ИИ в биологии — риск системных галлюцинаций?

2026-04-07 в 5:46, admin, рубрики: AI, Data Cascades, биоинформатика, ИИ, машинное обучение, научные исследования, нейросеть, обучение нейросетей

Почему в биологических проектах уверенность нейронок часто опережает реальное научное понимание, и какие выводы из этого стоит сделать разработчикам.

Главный триумф AI в биологии - AlphaFold. Проект не возник из ниоткуда, он опирается на Protein Data Bank PDBЧитать полностью »

Как я уместил «Войну и мир» в 10 ГБ видеопамяти, или почему нейросеть убивает героев и выдумывает Пьера Бездаровского

2026-04-01 в 15:28, admin, рубрики: llama 3, llm, nlp, python, война и мир, генерация текста, квантование, машинное обучение, нейросети, промпт-инжиниринг

Введение

Читать полностью »

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

2026-03-31 в 16:52, admin, рубрики: gpt, llm, галлюцинации, искусственный интеллект, машинное обучение, научпоп, сжатие данных, теория информации, Шеннон

Представьте, что вам дают 10 терабайт текста и говорят запихнуть это в файл на 70 гигабайт. Да так, чтобы потом по любому вопросу можно было восстановить нужный кусок. Не точно, но близко, и не побайтово, но чтобы по смыслу билось.

Вы бы сказали: «так это же lossy-компрессия, часть данных неизбежно потеряется».

И были бы правы, потому что именно это делает LLM.

Предсказание = сжатие (и это не метафора)

Тут нужно кое-что объяснить, и это самое важное в статье.

Клод Шеннон доказал в 1948 году: предсказание следующего символа и сжатие данных — математически одно и то жеЧитать полностью »

Заменит ли «Сложная обработка информации» востребованного специалиста?

2026-03-29 в 8:56, admin, рубрики: chatgpt, llm, алгоритм, искусственный интеллект, карьера ИТ-специалиста, карьера программиста, машинное обучение, нейросети, обучение IT, профессия

The Dartmouth College Artificial Intelligence Conference: The Next Fifty Years

Почему мы вообще обсуждаем конкуренцию людей и машин? Потому что мы стали жертвами удачного нейминга.

Возврат в 1950-е. Алан Тьюринг и Клод Шеннон дали базу. Но термин «ИИ»Читать полностью »

Образовательные программы CS-AI в Германии без немецкого языка: варианты, о которых мало кто знает

2026-03-29 в 7:00, admin, рубрики: AI, CS, jetbrains, бакалавриат, германия, магистратура, машинное обучение, образование, стипендия, университет

В 2023 году JetBrains запустил стипендиальную программу в немецком частном университете — с полным покрытием tuition fee, жилья и проживания для студентов CS/AI. Университет этот русскоязычным абитуриентам почти не известен. Ниже — разбор того, что это за место, какие там программы и стоит ли его рассматривать всерьез.

Когда русскоязычный абитуриент начинает смотреть варианты по CS и AI в Германии, в поле зрения обычно сначала попадают самые известные государственные университеты — TU Munich, RWTH Aachen, KIT и другие. На этом фоне легко возникает ощущение, что без немецкого языка выбор в Германии невелик.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «машинное обучение»

Какой минимум симптомов нужен врачу для постановки диагноза: теория грубых множеств вместо интуиции

Оглавление

Введение

Смогут ли микроконтроллеры с NPU заменить облако для распознавания речи?

Парадокс ансамблей: почему «слабые» модели иногда побеждают «сильные»

KV-Cache в LLM: разбираем инференс через 9 ключевых вопросов

Краткий справочник про внимания (self-attention, cross-attention, multi-head attention)

Почему ИИ в биологии — риск системных галлюцинаций?

Как я уместил «Войну и мир» в 10 ГБ видеопамяти, или почему нейросеть убивает героев и выдумывает Пьера Бездаровского

Введение

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Предсказание = сжатие (и это не метафора)

Заменит ли «Сложная обработка информации» востребованного специалиста?

Образовательные программы CS-AI в Германии без немецкого языка: варианты, о которых мало кто знает