So now we have much more voices and languages.
Рубрика «text-to-speech» - 2
Как я год строил расширениe для браузера которое читает статьи голосом (с синхронизацией в подкаст)
2018-05-29 в 12:28, admin, рубрики: Amazon Web Services, AWS, dynamodb, Go, python, text-to-speech, WebExtensions, подкасты, Расширения для браузеровНе один раз я пробовал использовать сторонние API для получения голоса из текста который мне интересно прочитать — можно переключить чтение на уши когда глаза устали, или слушать во время комьюта. Знаю я такой не один, даже люди далекие от айти бывает загружают куда-то текст и скачивают mp3. И подкасты/аудиокниги становятся все популярнее, и голосовые интерфейсы. Очевидно что аудитория есть, топовые экстеншены в маркете Хрома на эту тематику имеют сотни тысяч пользователей. Но голоса от Амазона обычно у них нет (лучший из доступных, лучше нового от Гугла), а где есть нет чего-то другого, например возможности слушать в экстеншене — а не только добавлять в свой подкаст. Предложил идею проекта внутри компании — был получен апрув — пошла разработка.

Читать полностью »
Чем грозит преждевременная автоматизация
2017-06-28 в 12:29, admin, рубрики: speech-to-text, text-to-speech, автоматизация, Блог компании UIS, виртуальная АТС, обработка звонков, распознавание речи, сценарии использования, телефония, Управление продажами, управление проектами
Оды автоматизации на основе технологий перевода речи в текст и обратно не утихают. Кто только не хвалится тем, как оптимизировал бизнес и сократил издержки. Да взять хотя бы нас самих: не только автоматизируем собственные процессы, а еще и другим помогаем. Но важно понимать, что автоматизация не только полезна, но и вредна. Под катом пара примеров второго вида (без имен, разумеется) плюс чек-лист, с помощью которого удастся не превратить первое во второе.
WaveNet: новая модель для генерации человеческой речи и музыки
2016-09-12 в 5:28, admin, рубрики: text-to-speech, wavenet, Блог компании Voximplant, генерация музыки, генерация речи, математика, машинное обучение, нейронные сети
Наша облачная платформа Voximplant — это не только телефонные и видео звонки. Это еще и набор «батареек», которые мы постоянно улучшаем и расширяем. Одна из самых популярных функций: возможность синтезировать речь, просто вызвав JavaScript метод say во время звонка. Разрабатывать свой синтезатор речи — на самая лучшая идея, мы все-таки специализируемся на телеком бэкенде, написанном на плюсах и способном обрабатывать тысячи одновременных звонков и снабжать каждый из них JavaScript логикой в реальном времени. Мы используем решения партнеров и внимательно следим за всем новым, что появляется в индустрии. Хочется через несколько лет отойти от мема «Железная Женщина» :) Статья, адаптированный перевод которой мы сделали за эти выходные, рассказывает про WaveNet, модель для генерации звука (звуковых волн). В ней мы рассмотрим как WaveNet может генерировать речь, которая похожа на голос любого человека, а также звучать гораздо натуральнее любых существующих Text-to-Speech систем, улучшив качество более чем на 50%.
Мы также продемонстрируем, что та же самая сеть может использоваться для создания других звуков, включая музыку, и покажем несколько автоматически сгенерированных примеров музыкальных композиций (пианино).
Читать полностью »
go-скрипт который делает аудиокнигу из текстового файла используя один из лучших синтезаторов речи — Ivona от Amazon
2016-01-21 в 12:37, admin, рубрики: accessibility, Amazon Web Services, api, Go, Google, google books, Ivona, nuance, Pocket, text-to-speech, TTS, Yandex, Yandex API, yandex speechkit, Облачные вычисления, метки: Ivona, tts Указываем в скрипте путь на книгу в txt — на выходе получаем папку с озвучкой хорошим синтезом.
Читать полностью »
yandex-speech — wrapper к речевым технологиям Яндекса
2014-08-11 в 15:25, admin, рубрики: api, javascript, node.js, nodejs, text-to-speech, TTS, voice recognition, YandexОзнакомившись с обзором движков для распознавания речи, заметил там API от Яндекса. И на выходных написал небольшую обертку для Node.js для распознавания речи с целью поиска мата в своих телефонных разговорах. По мотивам топика на Хабре.
Список нецензурных слов выкладывать не буду, а сам npm устанавливается командой.
npm install yandex-speech
Исходники и примеры использования:
github: www.github.com/antirek/yandex-speech
Немного деталей:
Читать полностью »
Синтезатор речи в iOS7
2013-11-05 в 7:19, admin, рубрики: ios7, mobile development, text-to-speech, Блог компании Touch Instinct, разработка под iOS, метки: ios7, text-to-speechВ iOS7 встроили синтезатор речи, теперь заставить свое приложение говорить вопрос пары строчек кода.
За синтез речи отвечает класс AVSpeechSynthesizer Достаточно передать ему текст обернутый в класс AVSpeechUtterance и текст будет прочитан смартфоном.
Голос зависит от локали, в том числе поддерживается русский. Речь звучит четко и приятно.
var speechSynthesizer = new AVSpeechSynthesizer ();
var speechUtterance =
new AVSpeechUtterance ("Shall we play a game?");
speechSynthesizer.SpeakUtterance (speechUtterance);
Дорогой «Читатель», тебе исполнился год. Поздравляем!
2013-09-11 в 10:30, admin, рубрики: App Store, text-to-speech, Блог компании Центр речевых технологий (ЦРТ), синтез речи, центр речевых технологий, читатель, метки: app store, text-to-speech, синтез речи, центр речевых технологий, читательДрузья! Нашему приложению «Читатель» на iPhone и iPad исполнился год!
Скачать в iTunes: itunes.apple.com/ru/app/id533851555 В конце поста — подарок.
За год мы приобрели 100 тыс. пользователей и их количество продолжает расти. Спасибо вам, друзья!
Читать полностью »
Почему украинских ребят не получится эффективный жестовый переводчик?
2012-07-10 в 15:35, admin, рубрики: Brainfuck, text-to-speech, будущее здесь, искусственный интеллект, обработка текстов, язык жестов, метки: text-to-speech, будущее здесь, искусственный интеллект, обработка текстов, язык жестовПосле интересной публикации об изобретении для глухо-немых (См. «Украинские студенты создали перчатки, переводящие язык жестов в речь»), за авторов которых был искренне рад, я выразил в комментариях своё сомнение о практической пользе такого новшества на текущий момент, будучи уверен в том, что на сегодня вряд ли получится какой-либо действенный инструмент, способный реально помочь понимать язык жестов.
А не получится он ровно по той же самой причине, которая препятствует созданию качественного естественно-язычного машинного переводчика. И причина эта кроется ровно в том, что компьютер, как мы знаем, не обучен понимать СМЫСЛ языкового сообщения, будь оно представлено, хоть, в вербальном виде, хоть, в эпистолярном (текстовом) виде, или даже в виде жестов. Читать полностью »
Украинские студенты создали перчатки, переводящие язык жестов в речь
2012-07-09 в 15:02, admin, рубрики: text-to-speech, будущее здесь, язык жестов, метки: text-to-speech, будущее здесь, язык жестов 
Проект Enable Talk украинской команды QuadSquad. Один из шести финалистов Microsoft`s Imagine Cup в Сиднее. Читать полностью »


