Неодушевлённые объекты, способные говорить, фигурировали еще в легендах древних цивилизаций. В шумерской мифологии бог войны Нинурта имел волшебную булаву, которая делилась тактическими советами в бою. Скандинавы считали, что Один заколдовал отрубленную голову некогда мудрого великана, чтобы она могла говорить. Но несмотря на популярный образ, первые попытки воплощения синтеза речи на технологическом уровне предприняли в XVIII веке. Рассказываем, кто этим занимался.
Рубрика «синтез речи» - 2
История синтезаторов речи: первые механические установки
2020-03-01 в 17:53, admin, рубрики: Аудиомания, аудиотехника, Блог компании Аудиомания, звук, история технологий, речевые технологии, синтез речиМногоязычный синтез речи с клонированием
2019-09-02 в 16:44, admin, рубрики: Tacotron, text-to-speech, TTS, машинное обучение, нейронные сети, синтез речиХотя нейронные сети стали использоваться для синтеза речи не так давно (например), они уже успели обогнал классические подходы и с каждым годам испытывают на себе всё новые и новый задачи.
Например, пару месяцев назад появилась реализация синтеза речи с голосовым клонированием Real-Time-Voice-Cloning. Давайте попробуем разобраться из чего она состоит и реализуем свою многоязычную (русско-английскую) фонемную модель.
Строение
Наша модель будет состоять из четырёх нейронных сетей. Первая будет преобразовывать текст в фонемы (g2p), вторая — преобразовывать речь, которую мы хотим клонировать, в вектор признаков (чисел). Третья — будет на основе выходов первых двух синтезировать Mel спектрограммы. И, наконец, четвертая будет из спектрограмм получать звук.
Нейросеть Facebook заговорила голосом Билла Гейтса
2019-06-17 в 15:58, admin, рубрики: будущее здесь, генерация звука, искусственный интеллект, синтез речи
Шон Васкез и Майк Льюис из компании Facebook представили синтезатор речи с новым принципом работы весьма эффектным образом: на аккаунте разработчиков на Github появилась коллекция сэмплов, где нейросеть убедительно имитирует речь основателя Microsoft. На записях звучат несколько коротких фраз произвольного содержания, в которых не только точно копируется тембр голоса Гейтса, но и тонко передаются естественные интонации — последнее долгое время оставалось для искусственного интеллекта недосягаемо высокой планкой.
Читать полностью »
Активность мозга человека впервые транслировали в чёткую речь
2019-02-01 в 15:58, admin, рубрики: вокодер, интерфейсы, мозг, мозговая активность, Научно-популярное, синтез речи
Схема метода реконструкции речи. Человек прослушивает слова, в результате активируются нейроны его слуховой коры. Данные интерпретируются четырьмя способами: сочетанием двух типов регрессионных моделей и двух типов речевых представлений, затем поступают в систему нейросетей для извлечения признаков, которые впоследствии используются для настройки параметров вокодера
Нейроинженеры Колумбийского университета (США) первыми в мире создали систему, которая переводит мысли человека в понятную, различимую речь, вот звукозапись слов (mp3), синтезированных по мозговой активности.
Наблюдая за активностью в слуховой коре головного мозга, система с беспрецедентной ясностью восстанавливает слова, которые слышит человек. Конечно, это не озвучивание мыслей в прямом смысле слова, но сделан важный шаг в этом направлении. Ведь похожие паттерны мозговой активности возникают в коре головного мозга, когда человек воображает, что слушает речь, или когда мысленно проговаривает слова.
Читать полностью »
ЦРТ объявляет конкурс по синтезу речи
2018-05-30 в 13:17, admin, рубрики: TTS, Алгоритмы, Блог компании Центр речевых технологий (ЦРТ), конкурс, машинное обучение, нейронные сети, синтез речи
Приглашаем поучаствовать в конкурсе по синтезу живой русской речи на основе технологий глубоких нейронных сетей. Конкурс рассчитан на студентов старших курсов, молодых специалистов и всех желающих, интересующихся машинным обучением и речевыми технологиями. Победитель получит 100 000 рублей!
Участникам TTS challenge предстоит создать и обучить систему синтеза и озвучить с её помощью несколько десятков предложений русского текста. Базу голоса для обучения предоставляет ЦРТ, методы достижения результата участники выбирают самостоятельно. О том, как сделать нейросетевой синтез своими руками, мы недавно рассказывали в этой статье.
Читать полностью »
Нейросетевой синтез речи своими руками
2018-05-17 в 15:57, admin, рубрики: TTS, машинное обучение, нейронные сети, синтез речиСинтез речи на сегодняшний день применяется в самых разных областях. Это и голосовые ассистенты, и IVR-системы, и умные дома, и еще много чего. Сама по себе задача, на мой вкус, очень наглядная и понятная: написанный текст должен произноситься так, как это бы сделал человек.
Некоторое время назад в область синтеза речи, как и во многие другие области, пришло машинное обучение. Выяснилось, что целый ряд компонентов всей системы можно заменить на нейронные сети, что позволит не просто приблизиться по качеству к существующим алгоритмам, а даже значительно их превзойти.
Я решил попробовать сделать полностью нейросетевой синтез своими руками, а заодно и поделиться с сообществом своим опытом. Что из этого получилось, можно узнать, заглянув под кат.
Читать полностью »
Нейросеть Tacotron 2 говорит с человеческими интонациями, на которых обучена
2017-12-21 в 19:04, admin, рубрики: Char2Wav, Deep Voice 3, Tacotron, Tacotron 2, wavenet, звук, искусственный интеллект, нейросеть, синтез речи
Архитектура Tacotron 2. В нижней части иллюстрации показаны модели предложение-к-предложению, которые транслируют последовательность букв в последовательность признаков в 80-мерном пространстве. Техническое описание см. в научной статье
Синтез речи — искусственное воспроизводство человеческой речи из текста — традиционно считается одной из составляющих частей искусственного интеллекта. Раньше такие системы можно было увидеть только в фантастических фильмах, а сейчас они работают буквально в каждом смартфоне: это системы Сири, Алиса и тому подобные. Вот только они не очень реалистично произносят фразы: голос неживой, слова отделены друг от друга.
Компания Google разработала продвинутый синтезатор речи нового поколения. Он называется Tacotron 2 и основан на нейросети. Для демонстрации его возможностей компания выложила примеры синтеза. Внизу странички с примерами можно пройти тест и попробовать определить, где текст произносит синтезатор речи, а где человек. Определить разницу практически невозможно.
Читать полностью »
Синтезатор речи «для роботов» с нуля
2016-07-18 в 15:28, admin, рубрики: Алгоритмы, вокодер, Программирование, робототехника, синтез звука, синтез речи
Давным-давно посетила меня идея создать синтезатор речи с «голосом робота», как, например, в песне Die Roboter группы Kraftwerk. Поиски информации по «голосу робота» привели к историческому факту, что подобное звучание синтетической речи характерно для вокодеров, которые используются для сжатия речи (2400 — 9600 бит/c). Голос человека, синтезированный вокодером, отдает металлическим звучанием и становится похожим на тот самый «голос робота». Музыкантам понравился данный эффект искажения речи, и они стали активно его использовать в своем творчестве.
Читать полностью »
Поговори со мной, Windows Phone
2015-04-07 в 7:56, admin, рубрики: C#, Phone, windows, детская, игра, Работа со звуком, разработка под windows phone, распознавание речи, синтез речиПока еще Cortana не стала доступной для русскоговорящих пользователей Windows Phone 8.1, а это ожидается скоро, я предлагаю вам самим сделать веселое апрельское приложение, с помощью которого можно будет поговорить с телефоном, покомандовать им, а может быть и поиграть.
На деле это, оказывается, довольно просто.
В качестве примера предлагаю сделать детское приложение, которое тренирует в устном счете до 10-ти. Приложение будем писать на XAML/C#
Читать полностью »
Мобильное приложение «Читатель» теперь для Android
2015-03-26 в 8:06, admin, рубрики: android, TTS, аудиокниги, Блог компании Центр речевых технологий (ЦРТ), мобильные приложения, синтез речи, смартфоны, читалка, Читальный зал, читатель, электронные книги, метки: Читатель
Три года назад мы выпустили мобильное приложение «Читатель» для iOS и от многих пользователей нам стали приходить письма с вопросом, собираемся ли мы выпустить версию под Android. Разработка завершена, и состоялся официальный запуск «Читателя» в Google Play.
Читать полностью »