Главная

Рубрика «оптимизация нейросетей»

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

2026-01-08 в 14:55, admin, рубрики: large language models, llm, оптимизация нейросетей

Эксперимент по хирургическому удалению слоёв из языковой модели

TL;DR

Я взял TinyLlama (1.1B параметров, 22 слоя) и начал удалять из неё слои, чтобы проверить гипотезу: современные LLM переобучены, и многие слои делают одно и то же.

Результаты:

Удалил 1 средний слой → +10% скорость, -4% качество
Удалил 7 слоёв (безопасных) → +30% скорость, -2.5% качество
Удалил первый слой → модель сломалась
Неожиданно: Layer 2 важнее Layer 0! (+6.67 vs +3.92 perplexity)

Протестировал все 22 слоя по отдельности. Вот что нашёл.

Зачем это нужно?

Читать полностью »

Как квантовать LLM. Практическое руководство для начинающих

2025-12-10 в 18:37, admin, рубрики: llm, искусственный интеллект, квантование, оптимизация нейросетей

Всем привет! Меня зовут Максим, я NLP‑инженер в red_mad_robot и автор Telegram‑канала Максим Максимов // IT, AI. Рост числа параметров в LLM и других нейронных сетях создает проблему того, что запускать их может все меньшее количество людей. Это связано с тем, что запуск больших моделей требует наличие мощного оборудования, недоступное всем.

Для решения этой проблемы разрабатываются различные виды оптимизации, позволяющие запускать крупные нейронные сети (в частности LLM) на менее мощном оборудовании. Одним из наиболее популярных подходов оптимизации LLM является квантизация.

Читать полностью »

Краткий гайд по квантованию нейросетей

2024-10-04 в 15:57, admin, рубрики: TensorFlow, как уменьшить память нейросети, квантование, машинное обучение, нейросеть, оптимизация нейросетей, ускорить модель ИИ

Мы достаточно написали статей про оптимизацию ваших нейросетей, сегодня пора перейти к дроблению, уменьшению и прямому урезанию, иначе квантованию данных. Сам по себе процесс этот несложный с точки зрения всего, но подводные камни у операции есть.

Читать полностью »

«А можно быстрее?»: практические советы по ускорению обучения нейросетей

2024-10-01 в 9:37, admin, рубрики: FastSample, gnn, pytorch, TensorFlow, автоген-челлендж, искусственный интеллект, машинное обучение, оптимизация нейросетей, ускорение нейросетей, ускорить обучение нейросетей

Мы продолжаем изучать, как ускоряют обучение нейросетей. В прошлой статье мы погрузились в теоретические аспекты этой проблемы. Сегодня перейдем к практике.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «оптимизация нейросетей»

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

TL;DR

Зачем это нужно?

Как квантовать LLM. Практическое руководство для начинающих

Краткий гайд по квантованию нейросетей

«А можно быстрее?»: практические советы по ускорению обучения нейросетей