Рубрика «TTS» - 2

Мы опубликовали стабильный, быстрый, качественный и доступный синтез для 20 языков России

2025-11-24 в 5:09, admin, рубрики: silero, text-to-speech, TTS, нейросети, озвучка, Россия, русский язык, синтез речи, Синтезатор, языки россии

Наконец-то представляем наш синтез для языков России и СНГ. В этот раз получилось покрыть 20 языков, всего 95 голосов. От старой демки этот релиз отличается следующим:

Читать полностью »

Разработка автономного речевого тренажёра для обучения иностранным языкам на основе больших языковых моделей

2025-10-25 в 13:15, admin, рубрики: asr, cloud, llm-модели, speech recognition, speech-to-text, TTS, Yandex.Cloud

Читать полностью »

KoboldCpp — нейросеть для развлечений и работы у нас дома

2025-07-07 в 10:27, admin, рубрики: AI, llm, ml, TTS, генерация изображений, искусственный интеллект, чат, чатботы

Читать полностью »

Телеграм-каналы теперь можно слушать

2025-06-10 в 18:18, admin, рубрики: chatgpt, telegram, TTS, ИИ, искусственный интеллект, Медиа, мини приложение, подкасты, телеграм-бот

Рассказываем, как с помощью ИИ мы создали стриминговую платформу для телеграм-каналов. И почему это нужно всем, у кого нет времени читать.

Каналов много, а времени мало

Читать полностью »

Как мы превращаем телеграм-каналы в радио с помощью ИИ

2025-06-06 в 14:51, admin, рубрики: chatgpt, telegram, TTS, искусственный интеллект, контент, Медиа, подкасты

Да, теперь телеграм-каналы можно слушать. Рассказываем, как это работает.

Каналов много, а времени мало

Телеграм-каналы уже давно победили традиционные СМИ. Но для чтения каналов нужно время. А с этим у многих из нас проблемы.

Читать полностью »

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

2025-01-09 в 11:46, admin, рубрики: TTS, азербайджанский язык, белорусский язык, казахский язык, русский язык, синтез речи, таджикский язык, татарский язык, узбекский язык, украинский язык

Привет!

Читать полностью »

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

2024-12-06 в 11:15, admin, рубрики: nlp, TTS, обработка естественного языка, синтез речи

Введение

VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shotЧитать полностью »

Один клик, и телеграм-каналы превращаются в…

2024-09-27 в 14:14, admin, рубрики: radiogram, telegram, TTS, ИИ, плеер, стриминг, телеграм-каналы

В подкасты! Рассказываем, как с помощью ИИ мы создали аудио-стриминг телеграм-каналов.

Один клик, и телеграм-каналы превращаются в… - 1

Сейчас в Телеграм много очень интересного контента. Но часто не хватает времени, чтобы все это читать. Вот тут-то и приходит на помощь Radiogram. Мы сделали так, что ваши любимые телеграм-каналы можно просто слушать – как подкасты.

Читать полностью »

Moshi: GPT4-O voice mode дома (обзор)

2024-09-24 в 14:33, admin, рубрики: AI, asr, Audio, large language model, llm, ml, nlu, sound, TTS

Intro

Прежде чем приступать к самому обзору, хотелось бы обозначить отличительные черты подхода, относительно большинства диалоговых систем:

Текущие системы работают в каскадной манере: сначала «активационное» слово, затем аудио переводится в текст (ASR), текст обрабатывается и анализируется, и, наконец, ответ генерируется через TTS. Однако это медленно, теряет эмоции и «живость» разговора, и, что самое важное, все взаимодействие происходит через жесткое чередование говорящих — сначала ты, потом я, и так далее.

Moshi не опирается на сложные каскадные пайплайны (ASR, NLU, TTS), а объединяет все эти функции Читать полностью »

Особенности фонетики якутского языка для синтеза речи

2024-08-20 в 16:44, admin, рубрики: TTS, русский язык, синтез речи, якутский язык

Недавно мы закончили проект по синтезу якутского языка. Хотя наши договорённости не позволяют выложить нам модели в общий доступ, какими-то соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.

Под ~~котом~~ катом вы узнаете:

Как звучит синтез на якутском языке;
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «TTS» - 2

Мы опубликовали стабильный, быстрый, качественный и доступный синтез для 20 языков России

Разработка автономного речевого тренажёра для обучения иностранным языкам на основе больших языковых моделей

KoboldCpp — нейросеть для развлечений и работы у нас дома

Телеграм-каналы теперь можно слушать

Как мы превращаем телеграм-каналы в радио с помощью ИИ

Каналов много, а времени мало

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

Введение

Один клик, и телеграм-каналы превращаются в…

Moshi: GPT4-O voice mode дома (обзор)

Intro

Особенности фонетики якутского языка для синтеза речи