Рубрика «синтез речи» - 2

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

2025-04-28 в 9:01, admin, рубрики: deep learning, machine learning, искусственный интеллект, машинный перевод, перевод видео, синтез речи, яндекс

Осенью 2021 года мы впервые представили Читать полностью »

Как я делал голосового ассистента на NLP и не сошел с ума

2025-04-05 в 16:38, admin, рубрики: nlp, OpenAI, python, Whisper, голосовой ассистент, машинное обучение, распознавание речи, синтез речи

Голосовые ассистенты давно перестали быть просто игрушкой — теперь это полноценные цифровые помощники, которые умеют общаться, искать информацию и даже шутить (иногда лучше некоторых людей). В этой статье разберём, как собрать своего кастомного ассистента с нуля на Python, используя современные NLP-инструменты. Без Siri, без Alexa, всё своё, родное.

Читать полностью »

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

2025-01-09 в 11:46, admin, рубрики: TTS, азербайджанский язык, белорусский язык, казахский язык, русский язык, синтез речи, таджикский язык, татарский язык, узбекский язык, украинский язык

Привет!

Читать полностью »

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

2024-12-06 в 11:15, admin, рубрики: nlp, TTS, обработка естественного языка, синтез речи

Введение

VALL-E 2, последнее достижение в области нейронных кодировочных языковых моделей, которое стало вехой в синтезе речи в zero-shot, достигнув человеческого уровня впервые. Zero-shotЧитать полностью »

Создаём генератор аудиокниг с персональным переводом

2024-12-02 в 8:15, admin, рубрики: nlp, python, timeweb_статьи, аудиокнига, аудиокниги, изучение английского, изучение иностранных языков, изучение языков, синтез речи

Привет!

Изучая четвёртый язык, я в очередной раз решил попробовать обучить свою биологическую нейросеть на книгах с параллельным переводом, но после пары вечеров в такой же очередной раз их оставил. Подобный подход, когда переводом сопровождается каждое предложение, кажется несколько избыточным и мешающим погружению, и если в текстовом варианте можно хотя бы перескочить взглядом через перевод, то для прочих форматов, например, для любимых мною аудиокниг, этот подход не сработает в принципе. Самый популярный вариант «обучающего перевода», которым пользовались и вы, – интерактивный, в котором пользователь следит за текстом на языке оригинала, и сам раскрывает переводы и пояснения забытых или новых для себя слов. Можно ли совместить эти подходы, взяв преимущества каждого, и переложить их в формат аудиокниги? Этим сегодня и займёмся.
Читать полностью »

Suno как аранжировщик etc.

2024-10-12 в 7:53, admin, рубрики: suno ai, аранжировка музыки, вирартек, генерация музыки, синтез речи

Доброго времени всем пользователям Suno и тем, кто интересуется технологиями ИИ в музыке. Как и ранее не претендую на полноту освещения вопроса, но надеюсь, что информация будет полезной.

Под аранжировкой обычно понимают создание инструментального трека (минусовки, backing track) на основе мелодии или мелодии + гармонии, с определенным стилем, темпом, формой/структурой. Suno генерирует песни (и инструментал) целиком с задаваемыми (относительно) стилем и формой. Показалось интересным протестировать систему на возможность создания нужной аранжировки. Особенно после своих экспериментов с Audio Input (см. Читать полностью »

Особенности фонетики якутского языка для синтеза речи

2024-08-20 в 16:44, admin, рубрики: TTS, русский язык, синтез речи, якутский язык

Недавно мы закончили проект по синтезу якутского языка. Хотя наши договорённости не позволяют выложить нам модели в общий доступ, какими-то соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.

Под ~~котом~~ катом вы узнаете:

Как звучит синтез на якутском языке;
Читать полностью »

Как Яндекс создал технологию эмоционального синтеза в Алисе

2024-08-20 в 8:00, admin, рубрики: алиса, генеративные модели, машинное обучение, синтез речи, Эмоции, яндекс

Уже скоро Алисе исполнится семь лет. К семи годам у людей уже формируется эмпатия: мы начинаем понимать чувства окружающих и осознаем, что эти чувства отражают внутреннее состояние собеседника.

Читать полностью »

Проблема омографов в ударениях и как я ее решал

2023-10-15 в 13:54, admin, рубрики: TTS, омографы, расстановка ударений, синтез речи, фонетика

Меня зовут Денис (tg: @chckdskeasfsd), и это история о том, почему в опенсурсе нет TTS с нормальными ударениями, и как я пытался это исправить.

Обзор проблемы

Читать полностью »

5 классных сервисов на основе ИИ (с примерами)

2023-03-09 в 5:30, admin, рубрики: AI, Блог компании RUVDS.com, искусственный интеллект, машинное обучение, облачные сервисы, обработка изображений, подборка сервисов, подборки, Программирование, сервисы, синтез речи

За последний год появилось огромное число новых сервисов, которые работают на нейронных сетях. Кажется, что уже не осталось людей, кто бы не слышал о том, что chatGPT пишет новости, а Midjorney во всю создает шедевры.

Сегодня я бы хотел показать 5 сервисов на основе нейронных сетей, которые не связаны с chatGPT, Midjorney или Stable Diffusion. Эти сервисы помогают обрабатывать аудио, преобразовывать текст в речь и удалять ненужные вещи с картинок.

Cleanvoice

Cleanvoice Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «синтез речи» - 2

Как мы научились сохранять тембр и интонацию спикера при переводе видео в Яндекс Браузере

Как я делал голосового ассистента на NLP и не сошел с ума

Читать полностью »

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

VALL-E 2: Нейронные кодировочные языковые модели являются синтезаторами речи с человеческим уровнем в zero-shot

Введение

Создаём генератор аудиокниг с персональным переводом

Suno как аранжировщик etc.

Особенности фонетики якутского языка для синтеза речи

Как Яндекс создал технологию эмоционального синтеза в Алисе

Проблема омографов в ударениях и как я ее решал

Обзор проблемы

5 классных сервисов на основе ИИ (с примерами)

Cleanvoice