Главная

Рубрика «diffusion models»

Долгая дорога к DiT (часть 2)

2025-10-26 в 15:29, admin, рубрики: diffusion models, mnist, python, pytorch

Новая задача

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

2025-10-21 в 10:53, admin, рубрики: diffusion models, Fine-tuning, image generation, lora, lora-адаптеры

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала!

Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting. Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке.

Читать полностью »

Что я вынес из Oxford Machine Learning Summer School 2025

2025-10-13 в 16:02, admin, рубрики: computer vision, diffusion models, edge ai, generative AI, llm, multimodal llm, oxford, машинное обучение

Mathematical Institute, University of Oxford

Вдохновлено обзором про похожую школу — EEML.

Читать полностью »

Полезные задачи на Kaggle ( LLM, Diffusion Models)

2025-09-16 в 15:01, admin, рубрики: AI, deep learning, diffusion models, kaggle, llm, machine learning

В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.

Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:

🌍 более 13 миллионов участников из разных стран;
🏆 сотни активных соревнований ежегодно;
📊 миллионы доступных датасетов и готовых ноутбуков.

Читать полностью »

Долгая дорога к DiT (часть 1)

2025-09-06 в 9:15, admin, рубрики: diffusion models, pytorch, искусственный интеллект

Это лето обрадовало нас прорывом в обработке изображений с помощью нейросетей. Одна за другой выходят такие модели как Flux.1 Kontext, Qwen-Image-Edit, Gemini 2.4 Flash Image Preview (Nano Banana) демонстрируя недостижимый до сих пор уровень манипуляции цифровым контентом. Это не замена Фотошопу, а технология, открывающая врата в бесконечные визуальные миры и всё благодаря мощи Diffusion Transformer (DiT) архитектуры. Впечатлившись, я решил поближе познакомиться с диффузными трансформерами - собственноручно натренировать свою собственную DiT-модель. Об этом и будет эта статья.

Но начать стоит с малого.

Базовая модель

Читать полностью »

Мечтают ли диффузионки о 3D-алайнменте, или что мы планируем рассказать на грядущей ICLR

2025-03-07 в 7:35, admin, рубрики: 3d, diffusion models, generationS, image-to-3d, NERF, text-to-3d

Привет! Меня зовут Нина, я работаю инженером исследователем в AIRI, где мы с моими коллегами активно исследуем возможности генеративного ИИ. Особое место в нашей рабочей повестке занимает применение диффузионных моделей к различным задачам.

Не так давно мы получили приятную новость: нашу статью Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «diffusion models»

Долгая дорога к DiT (часть 2)

Новая задача

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Что я вынес из Oxford Machine Learning Summer School 2025

Полезные задачи на Kaggle ( LLM, Diffusion Models)

Долгая дорога к DiT (часть 1)

Базовая модель

Мечтают ли диффузионки о 3D-алайнменте, или что мы планируем рассказать на грядущей ICLR