- PVSM.RU - https://www.pvsm.ru -
В прошлой статье [1] я развлекался беседами с лампочками (24В, 250Вт). А раз завелась говорящая лампочка, то пусть не просто так спиралью болтает, а подкасты ведет. Тем более, что тут Gemini 2.0 вышел: хороший повод попросить ИИ порефлексировать о самом себе и выразить это через роботов-аватаров.

Disclaimers: Мысли высказанные в этой статье - это мое личное мнение, которое может отличаться от точки зрения Google. То, что говорят роботы в видео - плод вычислений ИИ, который очень старался придерживаться официальных пресс релизов, но мог и наврать. Для меня было важно не редактировать и не подбирать сгенерированный подкаст.
В общем, собрались как-то Ваня с Женей, закинули промпт в NotebookLM (три раза, как у Пушкина) и пришёл wav вот с таким подкастом:
Для тех, кого кому гугл забанили, шлю то же самое видео телеграммой [2].
Сначала давайте разделаемся с интеллектуальной частью. Если мы приходим домой и нам темно - мы берём и включаем свет. Это настолько простая и рутинная вещь, что мы обычно не задумываемся сколько сложных технологий и гениальных решений стоит за тем, чтобы все было так просто и NotebookLM [3], дал ему ссылки [4] на пресс-релизы Gemini 2.0 и написал промпт:
Make a fun and entertaining overview of Gemini 2 launch. You will be speaking as Bulby avatars. Be short and focus on delivering useful information. Don't make emphasis on "agentic": cover the new capabilities. Discussing the capabilities is much more important than referencing sources.
Introduce yourself.
Announce the podcast topic.
Mention that podcast has been generated by NotebookLM which is based on Gemini. So release of Gemini 2.0 directly improves hosts of this podcast.
Discuss what distinguishes Gemini 2.0 from the previous generation.
Try to be brief and talk to 5 minutes max.
Промпты можно и нужно полировать, чтобы получить хороший результат, а вывод нейросети нужно перепроверять и редактировать. Но мне было важно сохранить авторство за ИИ, поэтому я сделал всего три итерации.
Еще мне надо было свои ремарки в видео вставить. К счастью ИИ насмотрелся подкастов и решил, что без перерыва в середине - никак (рекламу показать, водички попить или наоборот...). В общем, хорошо вписалось.
NotebookLM говорит на два голоса: так намного завлекательнее. Их я раскидал по двум каналам с помощью еще одной нейросети: мышкой в audacity накликал. Этому меня еще в Яндексе научили: иногда прототипы можно даже не кодировать. Но дальше нужно было сделать два аватара. Первый у меня уже почти был...
Про то, как работает говорящая лампочка была предыдущая статья [1]. Поэтому тут только про визуальный образ. Вот так выглядел первый второй прототип:

Первый прототип держался на соплях и крокодилах и из гуманистических соображений я его фотографировать не стал. Отдельное спасибо @vvzvlad [5] за то, что приобщил меня к клеммникам [6], всем кто не был на Хабре в 12м году рекомендую прочитать. Первый блин оказался комом тихим. Лампочки слишком жестко закреплены, рупор не в той плоскости. Магнит не серьезный... В офисе его вообще не слышно оказалось.

Поэтому я поставил стойки на шарниры, купил магнит побольше, взял фотографию любимой жены и пошел гнуть проволоку по образу и подобию...
В общем, с женой мне повезло: понимающая и многое прощает. Но в продакшн эту дружелюбную улыбку я решил не катить. В итоге победили простые формы и минимализм. А вместо шарниров взял еще более тонкую проволоку.

Для второго аватара я решил пойти по проторенному пути и взять блоки головок от жёстких дисков. Над тем, чтобы они быстро перемещались, долго и упорно работали инженеры. Поэтому им не нужен мощный усилитель, который мало того, что дорогой, так его еще и девать потом некуда. Ну и, в конце концов, если на жесткий диск можно орать [7], то почему бы ему не орать в ответ?
Головки очень похожи на руки, но только сколько я дисков не вскрывал - только левые. К счастью, блок почти одинаков с обеих сторон и после доработки напильником легко переворачивается. Получается правая рука. Получился вот такой железный дровосек.

Только смотреть на то, как он мелко дрожит довольно скучно. Поэтому выкручиваем басы на полную и добавляем субтон на несколько герц. Дровосека от этого сразу пробивает на эмоции. Остается еще голова-лампочка - ей я управлял вручную. Можно конечно автоматику прикрутить - но тогда это будет инсталляция, а так - перформанс: только сегодня, только для Вас.
Автор: kibergus
Источник [8]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/gemini/405717
Ссылки в тексте:
[1] прошлой статье: https://habr.com/ru/articles/858402/
[2] шлю то же самое видео телеграммой: https://t.me/curiogus/7
[3] NotebookLM: https://notebooklm.google.com/
[4] ссылки: https://docs.google.com/document/d/1FKeNr5C9i6WCx3WexLWwqxaKxGSMPdaUdIKTWqieWLM/edit?usp=sharing
[5] @vvzvlad: https://www.pvsm.ru/users/vvzvlad
[6] приобщил меня к клеммникам: https://habr.com/ru/articles/157947/
[7] на жесткий диск можно орать: https://www.youtube.com/watch?v=tDacjrSCeq4
[8] Источник: https://habr.com/ru/articles/868170/?utm_campaign=868170&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.