Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям

В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.

Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.

Китай и правда понесло: представлена нейросеть OmniHuman-1, которая создаёт максимально живые видео по фотографиям — Кадр из видео

«В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».

Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.

«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.

В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке ^[2].

Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max ^[3], которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B ^[4].

Источник ^[5]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/news/409818

Ссылки в тексте:

[1] Image: #

[2] примеров можно найти по этой ссылке: https://www.ixbt.com/click/?c=53616c7465645f5f631fbc03025cff9d4b1f38d53e2d85d1777454b3084d06b4895c7c06107451f615d28657fa0b6ecb414a9140ad7f8e30c3f1da047f24f8d0993136075d1f36aa0fa8171cab2f107f&h=637dfd7f0e20fff3c9c48c9dcb57eaccd2360524

[3] выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max: https://www.ixbt.com/news/2025/01/29/gpt-4o-deepseek-v3-llama-3-1-405b-alibaba.html

[4] сообщила о запуске новейшей ИИ-модели Janus-Pro-7B: https://www.ixbt.com/news/2025/01/28/deepseek-janus-pro-7b.html

[5] Источник: https://www.ixbt.com/news/2025/02/05/kitaj-i-pravda-poneslo-predstavlena-nejroset-omnihuman-kotoraja-sozdajot-maksimalno-zhivye-video-po-fotografijam.html

Нажмите здесь для печати.