- PVSM.RU - https://www.pvsm.ru -
«Нарисуй кошку за 30 секунд!.. О, я знаю, это кошка… А может быть, нет» — примерно в таком формате выдаёт результат распознавания рисунков нейросеть Quick, Draw!
Quick, Draw! [1] — одна из новых игр, которую выпустили разработчики Google в рамках проекта A.I. Experiments [2]. Здесь публикуются прикольные игрушки, которые позволяют даже ребёнку поиграть с искусственным интеллектом. Но есть игры и для взрослых.
Кроме удовольствия от игры и развлечения, эксперименты A.I. Experiments дают ещё и некоторое понимание того, на что способны нейросети и как их можно использовать на практике. Не только для развлечений.
aiexperiments.withgoogle.com/giorgio-cam [3]
Первая игра на сайте A.I. Experiments. Вероятно, самая интересная, по мнению разработчиков. Поместите объект перед объективом камеры на смартфоне или ПК, а нейросеть мгновенно составит стишок по итогу результата распознавания — и положит его под музыку! Иногда результат очень смешной. Особенно если навести камеру на необычные объекты.
В данном проекте используются программы MaryTTS [4], Tone.js [5], и Google Cloud Vision API [6]. Исходный код Giorgio Cam опубликован, как и всех других игр на проекте.
В игре Quick, Draw! искусственный интеллект даёт задание. Человек пытается быстро нарисовать, например, пальцем на планшете, а ИИ определяет, что изображено на рисунке. Получается весело, особенно если вы не очень умеете рисовать.
Что важно, нейросеть обучают следить за направлением движения пальца/курсора. За счёт этого она гораздо лучше распознаёт образцы.
aiexperiments.withgoogle.com/drum-machine [7]
Infinite Drum Machine показывает карту, на которой разные звуки инструментов размещены в соответствии со степенью их схожести. Если проводить мышкой по этому облаку, то звуки воспроизводятся по очереди. Если какой-то звук понравился, то размещаем его на драм-машине с четырьмя дорожками. Ну а затем запускаем на воспроизведение. Такое приложение стало бы хитом в Google Play. Впрочем, как и остальные игры на сайте A.I. Experiments.
Как сказано в описании, при разработке использовалась техника t-SNE [8], то есть нелинейного снижения размерности и визуализации многомерных переменных (t-distributed stochastic neighbor embedding). Алгоритм вычисляет цифровой отпечаток каждого звука и размещает его в многомерном пространстве, в соотношении с другими отпечатками. Для взамодействия с человеком многомерное пространство пришлось сплющить до двухмерного.
aiexperiments.withgoogle.com/bird-sounds [9]
Как и в предыдущей игре, здесь система с помощью техники t-SNE организовала по степени схожести тысячи звуков. Только звуки не инструментов, а птичьих голосов. Орнитологи десятилетиями собирали эту коллекцию.
aiexperiments.withgoogle.com/thing-translator [10]
«Переводчик вещей» переводит с одного языка на другой не слова, а предметы. Он буквально произносит вслух, как звучит любой предмет на выбранном вами языке.
Это всего лишь один пример того, что можно сделать, используя программные интерфейсы машинного обучения Google (Cloud Vision API [6] + Translate API [11]) — даже ничего не зная о машинном обучении.
aiexperiments.withgoogle.com/ai-duet [12]
Ещё одна интересная музыкальная игра от Google. Вы начинаете играть мелодию — а компьютер продолжает её за вас, используя наиболее красивое и логичное продолжение.
Как несложно догадаться, при обучении нейросети воспроизводились тысячи существующих мелодий. ИИ постепенно начал понимать ноты и распознавать гармонию в мелодическом рисунке. Понимать, в каких местах мелодия должна менять направление, в каком ритме продолжать мелодию и т.д. Он постепенно сам составил карту наиболее популярных, то есть гармоничных последовательностей и переходов.
Для максимального кайфа к компьютеру, конечно, желательно подключить MIDI-клавиатуру. Тогда с ИИ можно организовать полноценный композиторский дуэт, играя мелодию по очереди. Он продолжает начатое вами, а вы подыгрываете его варианту.
aiexperiments.withgoogle.com/visualizing-high-dimensional-space [13]
Этот эксперимент помогает понять, что творится в «мозгах» искусственного интеллекта. Программа визуализирует это на экране. Именно здесь можно своими глазами увидеть многомерное пространство, которое упоминалось ранее, и понять, как работает волшебная техника t-SNE. Каким образом организуются данные в пространствах, где количество измерений больше трёх.
Одна из авторов объясняет в демонстрационном видеоролике, что даже людей можно представить в виде многомерных объектов в многомерном пространстве. Это легко. В одном измерении у нас параметр «дата рождения» — и в этом измерении мы связаны с другими такими же многомерными объектами (людьми). В следующем измерении у нас параметр «место работы» — в этом измерении совершенно другие взаимосвязи. И так далее. Абсолютно все люди на планете входят в эту многомерную сеть. Такое же многомерное пространство строится для значений слов, для изображений, для мелодий и для любых других данных. Всё это потом используется в реальных приложениях, когда нейросеть обучается распознавать образы, понимать значения отдельных слов в пространстве смыслов.
Разработанная Google техника визуализации будет полезна всем разработчикам, которые работают с многомерными пространствами, t-SNE и нейросетями.
aiexperiments.withgoogle.com/what-neural-nets-see [14]
Ещё один эксперимент, который показывает внутренности «компьютерного мозга». В данном случае речь идёт не об измерениях многомерного пространства, а о слоях нейросети, каждый из которых реагирует на определённые сигналы. При последовательной обработке многими слоями нейросети, где каждый следующий слой обрабатывает результат предыдущего, ИИ начинает распознавать фичи всё более высокого уровня.
Автор: alizar
Источник [15]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/igry/210569
Ссылки в тексте:
[1] Quick, Draw!: https://quickdraw.withgoogle.com/
[2] A.I. Experiments: https://aiexperiments.withgoogle.com/
[3] aiexperiments.withgoogle.com/giorgio-cam: https://aiexperiments.withgoogle.com/giorgio-cam
[4] MaryTTS: https://github.com/marytts/marytts
[5] Tone.js: https://github.com/Tonejs/Tone.js
[6] Google Cloud Vision API: https://cloud.google.com/vision/
[7] aiexperiments.withgoogle.com/drum-machine: https://aiexperiments.withgoogle.com/drum-machine
[8] t-SNE: https://habrahabr.ru/post/267041/
[9] aiexperiments.withgoogle.com/bird-sounds: https://aiexperiments.withgoogle.com/bird-sounds
[10] aiexperiments.withgoogle.com/thing-translator: https://aiexperiments.withgoogle.com/thing-translator
[11] Translate API: https://cloud.google.com/translate/
[12] aiexperiments.withgoogle.com/ai-duet: https://aiexperiments.withgoogle.com/ai-duet
[13] aiexperiments.withgoogle.com/visualizing-high-dimensional-space: https://aiexperiments.withgoogle.com/visualizing-high-dimensional-space
[14] aiexperiments.withgoogle.com/what-neural-nets-see: https://aiexperiments.withgoogle.com/what-neural-nets-see
[15] Источник: https://geektimes.ru/post/282694/
Нажмите здесь для печати.