Создать своего виртуального двойника сегодня можно без камеры, студии и продакшена. Достаточно одного фото и пары инструментов. В итоге получается персонаж, который похож на вас, говорит вашим голосом и подходит для Reels, Shorts, TikTok, презентаций и обучающих видео.
Меня зовут Паша Захаров. Уже много лет занимаюсь диджиталом, стратегиями и развитием 360 проектов. Сейчас все больше углубляюсь в ИИ, и пытаюсь сделать свою рабочую жизнь проще.
Сегодня постарался подготовить и структурировать для вас гайд, в котором рассказал о том, как создать своего виртуального персонажа от фото до финального ролика.
Поехали.
1. Создаём визуальный образ персонажа
Задача — получить устойчивое и узнаваемое изображение по вашему фото.
Сервисы, которые подойдут лучше всего
Leonardo AI — реалистичные портреты, отлично удерживает черты лица.
Как работать:
-
Берите фронтальное фото.
-
Загрузите в Leonardo.
-
Сгенерируйте 10–20 вариантов.
-
Выберите 2–3 наиболее аккуратных.
Промпт:
Составь промпт для реалистичного портрета по фото. Ровный свет, натуральные цвета кожи, нейтральная мимика.
Midjourney — если нужен художественный стиль, «кинокадры».
Промпт:
A realistic portrait of a person with [описание], natural soft light, detailed skin texture, clean background, 85mm lens look.
PhotoMaker — когда нужно много вариаций лица с сохранением внешности.
2. Пишем короткий сценарий
Даже ролик на 20 секунд лучше воспринимается, если у него есть структура.
Запрос в GPT:
Напиши короткий сценарий ролика (до 25 секунд). Стиль — разговорный. Структура: зацепка — мысль — вывод.
Как скопировать стиль понравившегося ролика
-
скачать текст ролика через downsub.com
-
дайте GPT текст и запрос:
Проанализируй стиль автора и сформулируй правила, по которым мне писать свои ролики, подготовь похожим сценарий
3. Голос в ElevenLabs
Голос влияет на восприятие сильнее визуала.
Варианты:
-
записать свой голос (30–60 секунд);
-
выбрать голос и тембр в библиотеке.
Промпт:
Перепиши текст простыми фразами, короткими предложениями, добавь паузы.
4. Чистка в Audacity
Очень удобный инструмент, чтобы скорректировать от любых звуком до голоса.
-
убрать тишину
-
удалить щелчки
-
шумоподавление
-
лёгкая компрессия
-
громкость +1–2 dB
Голос становится чище и стабильнее.
5. Делаем говорящего AI-персонажа
Это ключевой этап. Ниже — актуальные инструменты + что с ними делать + настройки + рабочие промпты.
HeyGen — речь и мимика
Для чего:
-
речь
-
синхронизация губ
-
крупные планы
-
естественные движения лица
Плюсы:
-
лучший результат при озвучке
-
стабильное лицо
-
мягкая мимика
Минусы:
-
не делает движение камеры
-
мало движений тела
Что делать:
-
объяснения
-
советы
-
приветствия
-
короткие монологи
Промпт:
Перепиши текст короткими фразами для синхронизации губ.
Настройки:
-
Create Video → Upload Photo → включить Face Enhancement
-
Audio → Upload Voice → выбрать Voice Sync: Performance
-
Video Settings:
-
Eye Contact: Medium
-
Blinking: Natural
-
Mouth Movement: Balanced
-
-
Экспорт:
-
1080p
-
24 fps
-
Compression: Medium
-
Runway — сцены без речи, лёгкие движения
Для чего:
-
присутствие персонажа
-
повороты головы
-
лёгкие движения
-
эстетичные кадры для переходов
Плюсы:
-
плавная анимация
-
атмосферные сцены
Минусы:
-
не подходит для речи
Промпт:
A person standing by the window, soft daylight, slight head movement, calm expression.
Настройки:
-
модель Gen-2
-
Image Input → Add Image → включить Preserve Details
-
Motion:
-
Camera Motion: Subtle
-
Subject Motion: Low
-
Stabilization: On
-
-
Lighting: Soft Warm
-
Экспорт: 1080p / 24 fps
Pika — короткие акценты и движения
Для чего:
-
поворот головы
-
поднятие взгляда
-
лёгкий жест
-
динамичные вставки
Плюсы:
-
быстрые движения
-
добавляет динамику
Минусы:
-
не для речи
Промпт:
Close-up, slight head turn, natural light, smooth motion.
Настройки:
-
модель Pika 2
-
Motion Type: Subtle
-
Motion Speed: 0.4–0.6
-
Face Refinement — включить
Sora — окружение, движение камеры, атмосфера
Для чего:
-
вступления
-
финальные сцены
-
окружение персонажа
-
движение камеры как в живой съёмке
Плюсы:
-
реалистичная камера
-
мягкий свет
-
атмосферные переходы
Минусы:
-
не работает с мимикой
Промпт:
Handheld camera shot of a person walking on a quiet street during sunset, warm daylight, soft shadows, realistic motion.
Настройки:
-
Duration: 6–8 секунд
-
Camera Motion: Smooth Forward
-
Handheld Shake: Low
-
Depth of Field: On
-
Lighting: Natural Warm
-
Формат: 9:16
6. Генерируем дополнительные кадры
Чтобы ролик не был однообразным, используйте вставки:
-
предметы
-
атмосферные сцены
-
короткие визуальные метафоры
Промпт:
cinematic frame, warm soft light, shallow depth of field, natural tones, [описание сцены]
7. Монтаж в CapCut
-
длительность роликов: 15–30 секунд
-
переходы: fade или dissolve
-
выравнивание цвета между кадрами
-
голос громче музыки на 3–5 dB
-
короткие субтитры
Итог
Готовая цепочка выглядит так:
-
фото → визуальный образ (Leonardo / Midjourney / PhotoMaker)
-
GPT → сценарий
-
ElevenLabs → голос
-
Audacity → чистка звука
-
HeyGen → речь
-
Runway / Pika / Sora → движения и сцены
-
Midjourney / Leonardo → дополнительные кадры
-
CapCut → монтаж
Получается персональный AI-двойник, который выглядит естественно, говорит вашим голосом и подходит для любых форматов видео.
Спасибо от меня, что дочитали! Надеюсь, было полезно. До скорых встреч.
Автор: zaharovpavel
