- PVSM.RU - https://www.pvsm.ru -

В начале 2023 года я рассказывал о четвертой [1] версии Midjourney, а затем — о альфа-доступе к пятой [2]. Сейчас актуальная версия — 5.2, а недавно вышла альфа шестой.
Сохраним хронологию и посмотрим, что нового в пятой версии. Спойлер: разработчики уделили внимание не только процессу генерации, но и удобству пользователя.
Под катом рассказываю о нововведениях и различиях между релиз- и альфа-версией. Конечно, с иллюстрациями. Если формат окажется интересным, протестирую шестую Midjourney и напишу о ней в Академии Selectel [3]. Подробности под катом!

Запрос: woman portrait soft sunset light --seed 2131932819, --chaos 0 (слева [4]), --chaos 100 (справа [5])
В версии 5.2 появилось два параметра, которые влияют на эстетическую составляющую сгенерированных изображений.

Запрос: woman portrait soft sunset light --seed 2131932819 --weird 3000 (слева [6], справа [7]).
Параметр weird полностью соответствует названию не только из-за странных картинок, но и отсутствия детерминированности. Несовместимость с параметром seed и, как следствие, генерация разных изображений по одному «зерну» заявлена в документации [8].
Стоимость подписки на месяц не изменилась и составляет $30. Этот тарифный план включает 15 часов генерации в приоритетном режиме и безлимит в пониженном приоритете. Параллельно можно запускать до трех генераций.

Запрос: cat --seed 1123391209 (слева [9], справа [10])
В Midjourney существенно расширили функциональность для обработки изображений после первичной генерации. Сегодня доступны такие опции:

Пример: изменение фона.
Ура — в списке доступна самая желаемая функция: теперь можно перерисовать отдельные фрагменты изображений. При нажатии на кнопку Vary (Region) открывается редактор, в котором можно выделить прямоугольную или произвольную область и отредактировать запрос. Правда, текущий редактор не самый удобный.
Однако функция перерисовки уже есть — этого пока достаточно. Уверен, в будущем редактор станет более удобным. Главное, что это не единственная функция, которой может похвастаться пятая версия.

Отличия Subtle и Strong. Источник [11].
По умолчанию кнопки Vary (Strong) и Vary (Subtle) изменяют изображение по своему усмотрению, но через команду /settings можно включить режим Remix. Это позволит уточнить запрос для перегенерации.
Возможно, эти тексты тоже вас заинтересуют:
→ Революция или косметические изменения? Новые поколения серверных процессоров Intel [12]
→ Процессоры, диски, оперативка — топовое железо 2023 года [13]
→ Как создать веб-приложение на базе Telegram Mini Apps [14]
В четвертой версии алгоритма меня разочаровало, что отключили параметр --video. Я даже уточнил у поддержки и получил ответ, что такой функциональности «нет и не будет». Но что-то поменялось, этот параметр вернулся и работает для всех модификаций пятой версии модели.
Кроме того, в Midjourney v5 создавать видео можно не только для первичных генераций, но и вариаций. Если изначальный запрос содержит параметр --video, все перегенерации будут с видео.

Массовые операции — это еще одна функция, за которую хвалили Stable Diffusion. Теперь она доступна в Midjourney.
Дисклеймер: команды ниже запускают множество параллельных запросов, каждый из которых тарифицируется по отдельности.

Midjourney реализует синтаксис для создания комбинаций при запросе.
Что важно учитывать:
Например, запрос /imagine A {sculpture, painting} of a {seagull {on a pier, on a beach}, poodle {on a sofa, in a truck}} превратится в следующие команды:
/imagine A sculpture of a seagull on a pier.
/imagine A sculpture of a seagull on a beach.
/imagine A sculpture of a poodle on a sofa.
/imagine A sculpture of a poodle in a truck.
/imagine A painting of a seagull on a pier.
/imagine A painting of a seagull on a beach.
/imagine A painting of a poodle on a sofa.
/imagine A painting of a poodle in a truck.
Если в команде будет синтаксис комбинаций, нужно будет подтвердить действия. При этом в диалоге можно посмотреть, как именно раскрылись указанные комбинации.

Тюнер стилей (style tuner) — это необычный и дорогой инструмент для создания визуального стиля на основе опроса.
Алгоритм работы:
/tune с желаемым запросом;/imagine cat --style wi1MSMe3ruIbeSp0L8bt6T.
Пример тюнера в режиме «все изображения в случайном порядке».
Входные параметры для создания тюнера наталкивают на вопрос: можно ли использовать коды стилей в других запросах? Ответ: да, но это может привести к необычным результатам.
Тюнер стилей доступен только для fast-генерации, так что это дорогое удовольствие. Как можно бюджетно воспользоваться этой функциональностью?
--style random-X-Y, где X — это количество стилей (16, 32, 64 или 128), а Y — это процент выбранных стилей (если не указать, то по умолчанию 75%).https://tuner.midjourney.com/code/<код стиля>. Однако этот способ не работает для кодов, которые сгенерированы случайным образом.
Тюнер стилей совместим с параметром chaos, но не работает с параметром weird.
Один из интересных подходов для генерации схожих изображений — конвертация изображения в текст с последующей генерацией на основе последнего.

Арты Culpeo Fox, гном из Half-Life и Джонни Сильверхенд.
Для описания изображения в Midjourney есть команда /describe, которая принимает на вход файл. В результате возвращает четыре варианта описания, которые можно отредактировать и отправить на генерацию.

Ранее я затрагивал тему значимости определенных слов при генерации изображений. Тогда это было скорее наблюдение, а сейчас для этого есть отдельная команда — /shorten. Она возвращает список важных токенов, которые повлияют на генерацию, а также сокращенные варианты пользовательских запросов.

Кнопка Show Details позволяет посмотреть веса токенов.
Интересное наблюдение: в запросе
portrait of beautiful womanтокенайзер считает лишним слово woman. И если запрос состоит исключительно из portrait, то Midjourney в 100% случаев сгенерирует портрет девушки.

Сайт midjourney.com — это галерея пользовательских изображений. Раньше она решала вопрос доступа к своим генерациям лишь частично и сохраняла лишь таблицы изображений, а одиночные картинки загружались только после апскейлинга. Так что «вырезать» четвертинку все равно нужно было вручную. Сейчас эту проблему исправили: все изображения, в том числе со старых версий Midjourney, в галерее доступны раздельно.
На скриншоте выше видно интригующую заглушку. Кажется, интерфейс генерации изображений появится в веб-интерфейсе! Документация [16] разделилась на две ветки: Current и Legacy. При этом Legacy — это новая краткая документация по моделям ранних версий, а не просто «свалка» прошлогодней документации. Что из этого получится — увидим в будущем.
Если вам интересно читать топики о программировании, Telegram, играх и других технологиях, подписывайтесь на мой канал [17], где периодически пишу на разные темы. А еще — делитесь мнением о пятой версии Midjourney в комментариях.
Автор: Владимир
Источник [18]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/news/389275
Ссылки в тексте:
[1] четвертой: https://habr.com/ru/companies/selectel/articles/709944/
[2] пятой: https://habr.com/ru/companies/selectel/articles/722900/
[3] Академии Selectel: https://slc.tl/3ocp1
[4] слева: https://cdn.discordapp.com/attachments/1001883306146660443/1184904259117006918/f1remoon_woman_portrait_soft_sunset_light_3b608f45-bad4-495c-97a1-00612cf9850b.png
[5] справа: https://cdn.discordapp.com/attachments/1001883306146660443/1184904369624322108/f1remoon_woman_portrait_soft_sunset_light_0da526ae-2c31-4b73-b728-d0e714af27aa.png
[6] слева: https://cdn.discordapp.com/attachments/1001883306146660443/1184906181802721421/f1remoon_woman_portrait_soft_sunset_light_d4554755-8375-4ed6-b8c9-6817a0dc9e8c.png
[7] справа: https://cdn.discordapp.com/attachments/1001883306146660443/1184906016521977987/f1remoon_woman_portrait_soft_sunset_light_b44af60e-fea1-4789-98d5-467dfe49893b.png
[8] документации: https://docs.midjourney.com/docs/weird
[9] слева: https://cdn.discordapp.com/attachments/1001883306146660443/1184911654249582733/f1remoon_cat_e56af4e0-e258-444a-9c19-bc3f3d52993d.png
[10] справа: https://media.discordapp.net/attachments/1001883306146660443/1184912127199301712/f1remoon_cat_e43716cb-1886-4aef-ac91-4474db15733f.png
[11] Источник: https://docs.midjourney.com/docs/variations
[12] Революция или косметические изменения? Новые поколения серверных процессоров Intel: https://habr.com/ru/company/selectel/blog/779020
[13] Процессоры, диски, оперативка — топовое железо 2023 года: https://habr.com/ru/company/selectel/blog/783794
[14] Как создать веб-приложение на базе Telegram Mini Apps: https://habr.com/ru/company/selectel/blog/783462
[15] такая: https://tuner.midjourney.com/2yH1kxN
[16] Документация: https://docs.midjourney.com/
[17] канал: https://t.me/%252BVzpLr5pam-MxODEy
[18] Источник: https://habr.com/ru/companies/selectel/articles/777920/?utm_source=habrahabr&utm_medium=rss&utm_campaign=777920
Нажмите здесь для печати.