- PVSM.RU - https://www.pvsm.ru -
В ByteDance разработали систему искусственного интеллекта, которая преобразует фотографии в максимально реалистичные видеоролики.
Новая система под названием OmniHuman-1 генерирует видеоролики в полный рост, на которых люди жестикулируют и двигаются в соответствии с речью, превосходя предыдущие модели искусственного интеллекта, которые могли анимировать только лица или верхнюю часть тела.
«В последние годы сквозная человеческая анимация претерпела заметные улучшения, — заявили в ByteDance. — Однако существующие методы по-прежнему с трудом масштабируются в качестве больших общих моделей генерации видео, что ограничивает их потенциал в реальных приложениях».
Команда обучила OmniHuman-1 на более чем 18 700 часах человеческих видеоданных, используя новый подход, который объединяет несколько типов входных данных — текст, аудио и движения тела. Эта стратегия обучения «всеобщих условий» позволяет ИИ обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
«Наша главная идея заключается в том, что включение в процесс обучения множественных кондиционирующих сигналов, таких как текст, аудио и поза, может значительно сократить потери данных», — пояснила исследовательская группа.
В ходе тестирования OmniHuman-1 превзошла существующие системы сразу по нескольким показателям качества. Огромное количество примеров можно найти по этой ссылке [2].
Ранее китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max [3], которая, по словам представителей компании, превзошла высоко оцененную модель DeepSeek-V3. А DeepSeek сообщила о запуске новейшей ИИ-модели Janus-Pro-7B [4].
Источник [5]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/news/409818
Ссылки в тексте:
[1] Image: #
[2] примеров можно найти по этой ссылке: https://www.ixbt.com/click/?c=53616c7465645f5f631fbc03025cff9d4b1f38d53e2d85d1777454b3084d06b4895c7c06107451f615d28657fa0b6ecb414a9140ad7f8e30c3f1da047f24f8d0993136075d1f36aa0fa8171cab2f107f&h=637dfd7f0e20fff3c9c48c9dcb57eaccd2360524
[3] выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max: https://www.ixbt.com/news/2025/01/29/gpt-4o-deepseek-v3-llama-3-1-405b-alibaba.html
[4] сообщила о запуске новейшей ИИ-модели Janus-Pro-7B: https://www.ixbt.com/news/2025/01/28/deepseek-janus-pro-7b.html
[5] Источник: https://www.ixbt.com/news/2025/02/05/kitaj-i-pravda-poneslo-predstavlena-nejroset-omnihuman-kotoraja-sozdajot-maksimalno-zhivye-video-po-fotografijam.html
Нажмите здесь для печати.