Создать качественное видео можно без камеры, актёров и монтажа в сложных программах.
Главное — правильно выстроить процесс и корректно промптить GPT.
ChatGPT становится основным инструментом, который помогает придумать идею, написать сценарий, подготовить промпты, а потом адаптировать текст под озвучку и монтаж.
Меня зовут Паша Захаров, я автор Telegram-канала Цифровая рефлексия, в котором делюсь своими наблюдениями и рефлексирую на темы роста в диджитале и найме.
Ниже — подробный разбор, как собрать AI-видео с нуля:
от истории до финального клипа, который можно выложить в Reels, Shorts или иные органик-каналы.
Поехали.
1. Идея и сценарий: с чего начинается хорошее видео
Хорошее видео начинается не с одной фразы, а с структурированной истории.
Обычно это 4–6 сцен, где есть завязка, развитие, кульминация и финал.
Каждая сцена — это эмоция + действие + визуальный образ.
Если всё начинается с общей идеи — распишите её как историю.
Например, не “корабль тонет”, а:
«Корабль отправляется в плавание под ясным небом, не зная, что впереди ночь, которая всё изменит»
Так уже есть контраст, сюжет и настроение.
Далее, сценарий.
Запрос в GPT:
Помоги составить сценарий для короткого видео в 5 сцен в духе фильма «Титаник».
Опиши каждую сцену с деталями: место, действие, свет, звук, настроение, эмоцию.
Пример результата:
-
Закат, корабль идёт по спокойной воде, золотое отражение.
-
Девушка стоит у перил, ветер, лёгкая тревога.
-
Ночь. Слышно, как где-то скрипит металл, предчувствие.
-
Паника, вода в коридорах, мигает свет, шум и хаос.
-
Тишина. Кольцо падает в воду, камера замедляется.
Советы:
-
Добавляйте второстепенные звуки и свет (например, “звуки ветра”, “мерцающий огонь”) — они влияют на атмосферу видео.
-
Лучше сразу продумать смену настроения: от спокойствия к тревоге, от хаоса к тишине.
-
Если GPT написал шаблонно — просите добавить деталей:
Добавь контраст в настроении между сценами”
“Опиши чувства героев без лишней драмы”
-
Не бойтесь длины — чем конкретнее описание, тем точнее визуализация на следующих этапах.
2. Подготовка визуалов через Midjourney
После сценария переходите к визуалам.
Задача — превратить каждую сцену в кадр с правильным светом и атмосферой.
Для этого используйте GPT как переводчика между “историей” и “кадром”.
Запрос в GPT:
Напиши для каждой сцены промпт для Midjourney в кинематографичном стиле, с единым освещением, цветом и реализмом.
Пример промптов:
-
The Titanic sailing across calm ocean at sunset, golden reflections, cinematic composition, drone shot, 4k, warm light, detailed texture
-
A young woman on deck, wind blowing her hair, soft evening light, thoughtful look, 35mm film still, shallow depth of field
-
Night ocean, iceberg ahead, cold blue light, quiet tension, cinematic realism
-
Flooded corridor inside a ship, flickering lights, people running, chaos, realistic water texture, dramatic atmosphere
-
A golden ring sinking underwater, soft rays of light, still silence, cinematic clarity, 4k close-up
Практические советы:
-
Используйте одни и те же описания света и цвета в каждом промпте (golden light, cinematic, film look) — так картинки будут смотреться как единое видео.
-
Избегайте “лишних” слов вроде beautiful, stunning, gorgeous — они портят реализм.
-
Для вертикальных видео добавляйте --ar 9:16, для горизонтальных — --ar 16:9.
-
Уточняйте стиль: realistic, film grain, natural light, moody.
-
Если картинка выглядит “пластиковой”, добавьте в запрос:
"soft shadows, less contrast, natural tones”.
3. Анимация через Kling и Sora
Когда кадры готовы, нужно добавить движение.
Kling — делает из статичных картинок плавное движение.
Подходит для портретов, пейзажей, панорам.
Хорошо работает, если нужно лёгкое движение камеры.
Запрос в GPT:
Составь короткие промпты для Kling по этим сценам.
Пусть камера двигается плавно, свет естественный, без резких эффектов.
Примеры:
-
camera slowly moves forward above the ocean, warm light reflections
-
slow zoom in on woman’s face, soft wind, emotional atmosphere
-
handheld camera in corridor, flickering lights, water splashing, chaos
Советы:
-
Промпты делайте короткими (до 12 слов).
-
Избегайте лишних прилагательных — Kling лучше работает, когда вы описываете действие камеры, а не “красоту”.
-
Используйте слова: drone, zoom in/out, pan left/right, rotate slowly, natural motion.
-
Если кадр дёргается — добавьте “steady camera, slow movement”.
Sora — создаёт видео с нуля по описанию.
Она подходит, если нужно показать динамику — движение корабля, воду, ветер, панику.
Запрос в GPT:
Напиши промпты для Sora для этих сцен.
Видео должно быть реалистичным, 6–8 секунд, без карикатурных движений.
Примеры:
-
The Titanic sailing through calm ocean at sunset, gentle waves, cinematic motion, 4k realistic water texture, --duration 8s
-
A woman standing on deck, hair moving in wind, camera slowly circling around her, film look, 35mm, --duration 6s
-
Flooded corridor inside the ship, people running, water splashing, camera shaking lightly, realistic lighting, --duration 8s
Советы:
-
Для реализма добавляйте film grain, cinematic lighting, realistic water texture.
-
Для мягкости — slow motion, shallow focus, natural motion.
-
Проверяйте длину: если видео рвётся, уменьшите --duration.-
-
Важно, чтобы у всех сцен была одна температура цвета — иначе монтаж “ломается”.
4. Текст и озвучка через ElevenLavs
После визуалов и анимации нужен текст — короткий, точный и ритмичный.
Он должен дополнять видео
Запрос в GPT:
Напиши короткий текст для озвучки к этому видео (до 25 секунд), спокойный, с эмоцией и паузами.
Советы:
-
Текст лучше делить на 3–4 короткие фразы.
-
Делайте паузы — они важнее длинных предложений.
-
Под каждую фразу можно задать тайминг
Если не хочется накладывать текст, то можно попросить GPT предложить подходящую музыку исходя из сценария.
Озвучка через ElevenLabs
Здесь важно не просто “синтезировать”, а подобрать тембр, ритм и эмоцию. С этим также может помочь GPT:
Подбери стиль речи, тембр и эмоцию для озвучки текста:
Видео — короткое, драматичное, в духе фильмов о море и воспоминаниях.
Опиши, каким должен быть голос (тембр, скорость, интонация) и с каким акцентом это лучше прочитать для ElevenLabs.
Советы по ElevenLabs:
-
Мужской голос с низким тембром — для драмы.
-
Женский мягкий — для ностальгии и спокойствия.
-
Используйте stability 20–30%, clarity 70–80% — так звучание будет естественным.
-
Делайте несколько дублей — иногда “неидеальный” вариант звучит живее.
-
Если нужно больше эмоции — уменьшите stability, если нужно чётче — увеличьте clarity.
-
Озвучку делайте чуть медленнее обычного темпа — нейросети любят дыхание и паузы.
5. Монтаж и структура видео через CapCut
Когда у вас готовы видеофрагменты (из Kling или Sora), картинки, текст и озвучка — начинается самая важная часть: монтаж.
CapCut — оптимальный вариант: бесплатный, простой и позволяет добиться кинематографичного результата, если знать пару приёмов.
Запрос в GPT:
Разбей сценарий по таймингам для видео длиной 30 секунд.
Добавь рекомендации по темпу каждой сцены: где ускорить, где замедлить.
-
0:00–0:06 — закат и корабль, плавный темп.
-
0:06–0:10 — девушка у перил, лёгкое движение камеры.
-
0:10–0:18 — ночь и столкновение, быстрый монтаж.
-
0:18–0:25 — паника, мерцание, хаос.
-
0:25–0:30 — кольцо падает, тишина, длинный кадр.
Советы:
-
Формат: 9:16 для вертикальных видео, 16:9 для YouTube.
-
Качество: выстави 1080p или 4K, 30 fps (60 fps — если движение плавное).
-
Bitrate: 20–25 Mbps для 1080p, 40–50 Mbps для 4K.
-
Цвет: понизь насыщенность на 10–15%, добавь лёгкий фильтр “Cinematic” или “Warm Light”, выровняй яркость между сценами.
-
Стабилизация: включи Auto Stabilization, если камера дрожит.
-
Звук: голос громче музыки на 3–5 dB, добавь плавные Fade In/Out и лёгкий Reverb.
-
Переходы: используй простые Fade или Cross Dissolve, не длиннее 0.3 сек.
-
Финал: добавь 1 секунду тишины, проверь, чтобы свет, звук и ритм совпадали перед экспортом.
6. Общие советы и лайфхаки
-
Готовьте сценарий подробно. Чем детальнее описание сцен, тем меньше исправлений потом.
-
Держите стиль. Один фильтр, одна палитра, один свет — это создаёт эффект фильма.
-
Не бойтесь правок. Даже 2–3 итерации GPT дают качественно лучший результат.
-
Работайте сериями. Один стиль, разные сюжеты — это быстро создаёт узнаваемость.
-
Делайте референсы. В запросе к GPT можно написать:
“Сделай сценарий в стиле фильмов Нолана / ‘Прометей’ / ‘Дюнк’.”
Это помогает задать правильный визуальный ритм.
-
Озвучку и текст делайте последними. Тогда она ляжет на готовый темп видео, а не наоборот.
-
Делайте версию без звука. Часто ролики смотрят без звука, поэтому важен визуальный смысл.
-
Не бойтесь экспериментировать. Поменяйте свет, угол камеры, темп — даже мелкие детали влияют на восприятие.
Итог
ChatGPT помогает выстроить весь процесс: от сценария и промптов до текста и монтажа.
Midjourney — для визуалов, Kling и Sora — для движения, ElevenLabs — для озвучки, CapCut — для финальной сборки.
Главное — точные запросы, единый стиль и внимание к деталям.
Если держать контроль за светом, звуком и ритмом, видео будет выглядеть собранно и качественно, независимо от инструментов.
Спасибо, что дочитали! Надеюсь, что было полезно и интересно. До скорых встреч.
Автор: zaharovpavel
