Рубрика «TTS»

Телеграм-каналы теперь можно слушать - 1

Рассказываем, как с помощью ИИ мы создали стриминговую платформу для телеграм-каналов. И почему это нужно всем, у кого нет времени читать. 

Каналов много, а времени мало

Читать полностью »

Как мы превращаем телеграм-каналы в радио с помощью ИИ - 1

Да, теперь телеграм-каналы можно слушать. Рассказываем, как это работает.

Каналов много, а времени мало

Телеграм-каналы уже давно победили традиционные СМИ. Но для чтения каналов нужно время. А с этим у многих из нас проблемы.

Читать полностью »

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot - 1

Введение

VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shotЧитать полностью »

В подкасты! Рассказываем, как с помощью ИИ мы создали аудио-стриминг телеграм-каналов.

Один клик, и телеграм-каналы превращаются в… - 1

Сейчас в Телеграм много очень интересного контента. Но часто не хватает времени, чтобы все это читать. Вот тут-то и приходит на помощь Radiogram. Мы сделали так, что ваши любимые телеграм-каналы можно просто слушать – как подкасты.

Читать полностью »

Intro

Прежде чем приступать к самому обзору, хотелось бы обозначить отличительные черты подхода, относительно большинства диалоговых систем:

Текущие системы работают в каскадной манере: сначала «активационное» слово, затем аудио переводится в текст (ASR), текст обрабатывается и анализируется, и, наконец, ответ генерируется через TTS. Однако это медленно, теряет эмоции и «живость» разговора, и, что самое важное, все взаимодействие происходит через жесткое чередование говорящих — сначала ты, потом я, и так далее.

  • Moshi не опирается на сложные каскадные пайплайны (ASR, NLU, TTS), а объединяет все эти функции Читать полностью »

Девушки кричат на кота на якутском

Девушки кричат на кота на якутском

Недавно мы закончили проект по синтезу якутского языка. Хотя наши договорённости не позволяют выложить нам модели в общий доступ, какими-то соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.

Под котом катом вы узнаете:

Проблема омографов в ударениях и как я ее решал - 1

Меня зовут Денис (tg: @chckdskeasfsd), и это история о том, почему в опенсурсе нет TTS с нормальными ударениями, и как я пытался это исправить.

Обзор проблемы

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js