- PVSM.RU - https://www.pvsm.ru -

На чём прокалывается ИИ при генерации человеческих лиц

В 2014 году исследователь в области машинного обучения Ян Гудфеллоу выдвинул идею генеративных состязательных сетей [1] или GAN. «Генеративность» состоит в том, что результатом их работы являются изображения, а не оценка ввода (типа «хот-дог или нет»), а «состязательность» — в том, что две нейросети играют в кошки-мышки [2], как федералы с фальшивомонетчиками: одна нейросеть пытается обмануть другую, создавая реалистичные картинки, а вторая старается отличить фейк.

Первые изображения GAN было легко идентифицировать. Посмотрите на эти лица 2014 года [3].

На чём прокалывается ИИ при генерации человеческих лиц - 1
«Обучение без учителя представлению с глубокими свёрточными генеративными состязательными сетями» (2014), Рэдфорд и др. Также известны как DCGAN

Но последние сгенерированные лица от октября 2017 года [4] уже труднее идентифицировать.

На чём прокалывается ИИ при генерации человеческих лиц - 2
«Прогрессивное выращивание GAN для улучшения качества, стабильности и разнообразия» (2017), Каррас и др. Также известны как PGAN или ProGAN

Вот некоторые признаки изображений, которые сгенерировала GAN. Сосредоточимся на лицах, потому что они являются общей площадкой тестирования для исследователей, а многие из самых заметных артефактов появляются и в других видах изображений.

Прямые волосы выглядят как краска

На чём прокалывается ИИ при генерации человеческих лиц - 3

Длинные волосы часто выглядят гипертрофированно прямыми прядями, словно кто-то мазанул кучу акрила мастихином или огромной кистью.

Текст не поддаётся расшифровке

На чём прокалывается ИИ при генерации человеческих лиц - 4

Если GAN обучалась на лицах, то ей трудно даются редкие структурированные объекты на заднем плане. Кроме того, GAN обучаются и на стандартных, и на зеркальных версиях изображений, что приводит к проблемам при моделировании текста, который обычно отображается только в одной ориентации.

Cюрреалистичный фон

На чём прокалывается ИИ при генерации человеческих лиц - 5

Одна из причин, почему сгенерированные лица выглядят правдоподобно — потому что все обучающие картинки были центрированы. Это уменьшает вариативность при генерации, например, глаз и ушей. С другой стороны, фон может содержать что угодно. Его слишком трудно смоделировать, поэтому нейросеть в конечном итоге реплицирует общие фоновые текстуры, а не «реальные» фоновые сцены.

Асимметрия

На чём прокалывается ИИ при генерации человеческих лиц - 6

GAN может испытывать трудности при управлении зависимостями, которые находятся на большом расстоянии. Например, парные аксессуары, такие как серьги, обычно совпадают в наборе данных, но не в созданных изображениях. Глаза на настоящих фотографиях обычно смотрят в одном направлении и обычно одного цвета, а сгенерированные лица часто страдают косоглазием и гетерохромией. Асимметрия часто проявляется на ушах разной высоты или размера.

Странные зубы

На чём прокалывается ИИ при генерации человеческих лиц - 7

Сети GAN могут собрать общую сцену, но в настоящее время испытывают трудности с полурегулярными повторяющимися деталями, такими как зубы. Иногда GAN выдаёт перекошенные зубы, растягивает или сжимает отдельные зубы странными способами. Исторически эта проблема проявлялась и в других областях, таких как синтез текстур [5] с изображениями типа кирпичей.

Хаотичные волосы

На чём прокалывается ИИ при генерации человеческих лиц - 8

Это один из самых быстрых способов распознать фейковое изображение. Как правило, GAN собирает волосы в комочки, создаёт случайные пучки вокруг плеч и бросает на лоб толстые лохмы. Настоящие причёски очень вариативны и детализированы, что делает их одним из самых трудных объектов для реалистичной генерации GAN. Посторонние объекты иногда могут превратиться в волосяные текстуры.

Непонятный пол

На чём прокалывается ИИ при генерации человеческих лиц - 9

Эта GAN обучалась на наборе CelebA [6] с 200 000 изображений 10 000 знаменитостей. В данном наборе я не встречала никого с волосами на лице, серьгами и макияжем одновременно; но GAN регулярно смешивает типичные атрибуты разных полов. В целом, я думаю, это связано с тем, что GAN не всегда получает представление о противоположных бинарных категориях, которые приняты в человеческом обществе (в данном случае «мужчина против женщины»).

Полурегулярный шум

На чём прокалывается ИИ при генерации человеческих лиц - 10

Некоторые области вместо монохромного фона могут получить полурегулярный шум с горизонтальными или вертикальными полосками. В приведённых выше случаях, вероятно, сеть пытается имитировать текстуру ткани. Более старые GAN генерируют гораздо более заметный шум, который обычно описывают как шахматные артефакты [7].

Радужная засветка

На чём прокалывается ИИ при генерации человеческих лиц - 11

Некоторые области со светлой сплошной заливкой получают многоцветную засветку: это воротники, шеи и белые глаза (здесь не показаны).

Примеры реальных изображений

На чём прокалывается ИИ при генерации человеческих лиц - 12

Оратите внимание на чёткий фон, текст, парные серьги, зубы одинакового размера, детальные причёски. Зная все трюки GAN, попробуйте сыграть в игру [8] и проверить, как вы отличите настоящие лица от поддельных. Примечание: у некоторых проблемы [9] с кнопкой Start.

Автор: m1rko

Источник [10]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/obrabotka-izobrazhenij/301643

Ссылки в тексте:

[1] генеративных состязательных сетей: https://arxiv.org/abs/1406.2661

[2] играют в кошки-мышки: https://www.nytimes.com/interactive/2018/01/02/technology/ai-generated-photos.html

[3] эти лица 2014 года: https://arxiv.org/abs/1511.06434

[4] от октября 2017 года: https://arxiv.org/abs/1710.10196

[5] синтез текстур: https://www.cs.tau.ac.il/~dcor/Graphics/pdf.slides/texture-syn-2016.pdf

[6] CelebA: http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

[7] шахматные артефакты: https://distill.pub/2016/deconv-checkerboard/

[8] игру: http://nikola.mit.edu/experiment

[9] у некоторых проблемы: https://www.reddit.com/r/MachineLearning/comments/a34ner/p_can_you_tell_if_these_faces_are_real_or/eb3syoc/

[10] Источник: https://habr.com/post/432580/?utm_source=habrahabr&utm_medium=rss&utm_campaign=432580