Рубрика «deep learning» - 2

Правда ли KAN лучше MLP? Свойство разделения глубины между двумя архитектурами

2025-07-22 в 11:15, admin, рубрики: approximation, deep learning, kan, machine learning, math, MLP, neural networks, research, science

Введение

Прошлым летом в свет вышла новая архитектура нейронных сетей под названием Kolmogorov-Arnold Networks (KAN). Основная статья есть в открытом доступе на архиве по следующей ссылке. На момент выхода статьи эта новость произвела фурор в мире машинного обучение, так как KAN показывали существенный прирост в качестве аппроксимации различных сложных функций. На фото ниже видно, что ошибка новых сетей падает значительно быстрее при увеличении числа параметров.

Читать полностью »

Я построил Vision Transformer с нуля — и научил его обращать внимание

2025-07-04 в 13:16, admin, рубрики: computer vision, deep learning, implementation, pytorch, Transformers

Vision Transformer (ViT) — это архитектура, которая буквально произвела революцию в том, как машины «видят» мир.

В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать эту магию своими руками, шаг за шагом, даже если вы никогда раньше не работали с трансформерами для задач с изображениями.

Для начала давайте взглянем на архитектуру Vision Transformer:

Читать полностью »

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

2025-06-25 в 9:40, admin, рубрики: computer vision, deep learning, face recognition, глубокое обучение, Компьютерное зрение, машинное обучение, низкое качество, низкое разрешение, обработка изображений, распознавание лиц

Читать полностью »

Хорошая девушка LoRA! А чем же она хороша?

2025-06-09 в 13:20, admin, рубрики: deep learning, lora, LoRA Fine-tuning, machine learning, nlp

Поговорим об методике дообучения LLM… спортсменке, комсомолке и просто красавице - LoRA, которая если и не снимается в кино, то может сделать фильмы качественней и интереснее для зрителя. Исторические данные проката и состава творческих групп в перспективе позволяют работать с ансамблевыми моделями машинного обучения для прогнозирования сборов и просмотров в кино, и улучшать данные и путем их подбора «гиперпараметров»Читать полностью »

Играемся с RTX 5090 (GB202) для инференса

2025-05-27 в 17:42, admin, рубрики: 5090, blackwell, deep learning, GeForce, Nvidia, nvidia rtx 5090, видеокарта, Железо, машинное обучение, нейросети

Продолжаем статьи про практические тесты актуальных картонок от Nvidia (A5000 Ada, A100, 3090 и A10 Читать полностью »

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

2025-04-28 в 9:01, admin, рубрики: deep learning, machine learning, искусственный интеллект, машинный перевод, перевод видео, синтез речи, яндекс

Осенью 2021 года мы впервые представили Читать полностью »

Обзор решений для создания AI-аватаров. История развития и практическое применение

2025-04-14 в 16:10, admin, рубрики: AI, ai аватары, ai персонажи, deep learning, виртуальные персонажи, генерация видео, искусственный интеллект, контент, цифровые медиа

Всем привет!

Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь материалами, которые помогают:

Продуктовым менеджерам — интегрировать AI без перегрузки команд;
Разработчикам — выбирать инструменты под конкретные бизнес-задачи;
Специалистам по данным — избегать ошибок в production-развертывании.

У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей.

Сегодняшний перевод — AI Avatars Escape the Uncanny Valley Читать полностью »

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

2025-04-09 в 12:00, admin, рубрики: deep learning, DL, ml, selectel, глубокое обучение, ИИ, искусственный интеллект, машинное обучение, познавательное

Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в ~~руку~~ пальцы Ctrl/Cmd+F и начинаем раскопки!Читать полностью »

Десять уроков развития аппаратных ускорителей для ИИ: как эволюция TPU привела к созданию TPUv4i

2025-03-18 в 20:24, admin, рубрики: deep learning, inference, ml, proceesors, pytorch

В последние годы стало очевидно, что классические центральные процессоры (CPU) и видеокарты (GPU) уже не всегда поспевают за непрерывным ростом и усложнением нейронных сетей. Вместо бесконечного наращивания «универсального» железа, компании начали разрабатывать и внедрять в своих дата-центрах Domain-Specific Architecture (DSA) — аппаратные ускорители, заточенные под конкретные задачи.

Google TPU (Tensor Processing Unit) — одно из первых крупных решений такого рода. Начиная с 2015 года (поколение TPUv1), Google успела вывести на рынок несколько поколений TPU для внутренних нужд: TPUv1 и TPUv2/v3, а в 2020 году — новое решение TPUv4iЧитать полностью »

Исследуем эволюцию архитектур в Computer Vision: Mind Map всех ключевых моделей

2025-03-13 в 16:58, admin, рубрики: computer vision, deep learning, machine learning, mind maps, neural networks, resnet, Transformers, машинное обучение, нейронные сети

Сразу к карте? Если вы предпочитаете действовать, а не читать, вот ссылка на Mind Map . Она доступна для изучения прямо сейчас. А если хотите понять контекст и узнать больше о каждой модели — добро пожаловать под кат!

Введение

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «deep learning» - 2

Правда ли KAN лучше MLP? Свойство разделения глубины между двумя архитектурами

Введение

Я построил Vision Transformer с нуля — и научил его обращать внимание

Vision Transformer (ViT) — это архитектура, которая буквально произвела революцию в том, как машины «видят» мир.

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

Хорошая девушка LoRA! А чем же она хороша?

Играемся с RTX 5090 (GB202) для инференса

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

Обзор решений для создания AI-аватаров. История развития и практическое применение

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Десять уроков развития аппаратных ускорителей для ИИ: как эволюция TPU привела к созданию TPUv4i

Исследуем эволюцию архитектур в Computer Vision: Mind Map всех ключевых моделей

Введение