Рубрика «diffusion»

Kandinsky 5.0 vs Stable Diffusion: практический тест на 6 сценариях для иллюстраций и ассетов

2025-12-19 в 13:50, admin, рубрики: diffusion, Kandinsky 5.0, stable diffusion, генерация изображений, нейросети, сезон ии в разработке

В разработке мне регулярно нужны картинки “вокруг кода”: обложки к техпостам/README, иллюстрации в документацию, а иногда — быстрые ассеты/референсы для пет-проектов.
В рамках сезона решил протестировать Kandinsky 5.0 на типовых сценах и сравнить ощущения с привычным пайплайном на Stable Diffusion: где быстрее получить годный результат без плясок с промптом, а где лучше иметь “запасной аэродром”.

Под “разработческими задачами” здесь я имею в виду не генерацию кода, а задачи вокруг продукта: обложки к постам/README, иллюстрации к документации и быстрые прототипы визуалов/ассетов для пет-проектов.

Методика и сетап

Читать полностью »

K-VAE токенизатор от Сбера

2025-11-14 в 13:27, admin, рубрики: diffusion, VAE, генеративные модели, сжатие видео, сжатие изображений

Одни из самых перспективных решений среди генеративных моделей принадлежат к классу LDM (latent diffusion models): Stable Diffusion, Wan, Flux и многие другие. Превращение шума в изображение происходит в два этапа: сперва диффузионная модель создаёт латент, который затем декодируется в изображение намного большего размера. За декодирование и формирование латентного пространства в большинстве моделей этого класса отвечает токенизатор изображений. Таким образом, качество этой модели напрямую влияет на результаты генерации.

Читать полностью »

Часть 3: Diffusion Transformer (DiT) — Stable Diffusion 3 как она есть

2025-07-02 в 16:11, admin, рубрики: diffusion, stable diffusion, transformer, VAE

Обо мне

Привет, меня зовут Василий Техин. В первой статье мы разобрали ResNet, во второй — ViT. Теперь погрузимся в мир генерации изображений с Diffusion Transformer (DiT) — сердцем Stable Diffusion 3.

Пролог: От распознавания к созданию

Представьте нейросеть как художника. Раньше она только анализировала картины ("Это Ван Гог!"). Теперь она создаёт шедевры в стиле Ван Гога и не только!

Читать полностью »

Пишем свою Diffusion модель с нуля

2024-11-21 в 16:41, admin, рубрики: diffusion, machine learning, stablediffusion, нейросети

Всем привет, думаю у вас на слуху разного рода Diffusion модели последние 2 года. На его основе генерируют реалистичные изображения и видео, поэтому мне захотелось копнуть поглубже и узнать какова кроличья нора...

Меня зовут Юра, я - разработчик, фаундер и временами ML энтузиаст. Я решил разобраться и понять, как устроена Diffusion модель внутри, понять ее математику и постараться объяснить и разложить ее на пальцах. Ну и конечно пописать код, который (спойлер) заработал. На гифке изображены примеры итоговых картинок на моей финальной модели.

Если вам тоже интересно, милости прошу под кат.

Читать полностью »

Обучение модели Stable Diffusion текстовой инверсии с помощью diffusers

2022-09-18 в 12:14, admin, рубрики: colab, colaboratory, diffusion, github, python, stable diffusion, будущее здесь, графический дизайн, искусственный интеллект, текстовая инверсия

Листая интернет на наличие интересных технологий в области нейронных сетей и различного искусства,я наткнулся на пост в Твиттере, в котором Suraj Patil объявил о возможности обучения модели Stable Diffusion текстовой инверсии используя всего 3-5 изображений.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «diffusion»

Kandinsky 5.0 vs Stable Diffusion: практический тест на 6 сценариях для иллюстраций и ассетов

Методика и сетап

K-VAE токенизатор от Сбера

Часть 3: Diffusion Transformer (DiT) — Stable Diffusion 3 как она есть

Обо мне

Пролог: От распознавания к созданию

Пишем свою Diffusion модель с нуля

Обучение модели Stable Diffusion текстовой инверсии с помощью diffusers