Рубрика «голос»

Google запустил сервис, где нейросеть оценивает вокал пользователя и сравнивает с Фредди Меркьюри - 1

Google открыл в общий доступ для всех пользователей экспериментальный онлайн-сервис с использованием искусственного интеллекта — FreddieMeter.

Этот интересный проект создан компанией Google совместно с YouTube, в разработке приняли участие подразделения Google Creative Lab и Google Research в сотрудничестве с группой Queen и студиями звукозаписи Universal Music Group и Hollywood Records. На недавно запущенном онлайн-портале, созданном Google, предлагается всем пользователям сравнить свои вокальные данные с голосом легендарного Фредди Меркьюри.
Читать полностью »

Это может делать наша нейросеть, распознающая человека по одному произнесенному слогу. Однако тема этой статьи не касается напрямую идентификации по голосу, хотя и будет связана с ней. Мы расскажем о нейросетевых фичах, так называемых d-vector, которые можно использовать в задачах обработки звука: от верификации до распознавания речи и эмоций.

image

Читать полностью »

Выразительность человеческого голоса уникальна. Он позволяет людям обмениваться информацией, воздействует на наши эмоции, может служить источником напряжения или расслабления и быть «музыкальным инструментом». Сегодня рассказываем о том, как голос используется в различных ситуациях и влияет на наше настроение и действия.

Кстати, если вам больше нравится микроформат — у нас есть свой Telegram-канал.

От аукционов до колыбельных: как и где «работает» человеческий голос - 1Читать полностью »

Сервис Google Duplex пугает своей красивой и правильной речью, есть недовольные - 1

Несколько дней назад корпорация Google представила сразу несколько новинок, которые взбудоражили как представителей телекоммуникационной сферы, так и обычных людей. Одна из них — сервис Google Duplex, это слабая форма ИИ, способная позвонить вместо своего пользователя в парикмахерскую и записать человека на определенное время.

Duplex можно считать своего рода цифровым ассистентом человека, причем гораздо более «человечным» чем те же Siri или Cortana. Обычные разговоры ассистент вести не может, работа его касается лишь назначения времени встречи или приема. Но «речь» виртуального помощника звучит очень реалистично. Вряд ли кто-либо из нас смог бы отличить ее от речи обычного человека. И как раз эта схожесть напугала некоторых специалистов по информационной безопасности.
Читать полностью »

image

Рынок голосовых ассистентов расширяется, особенно для русскоязычных пользователей. 2 недели назад Яндекс рассказала впервые про платформу Яндекс.Диалоги, 2 месяца назад Google представила возможность писать диалоги для Google Assistant на русском языке, 2 года назад со сцены Bill Graham Civic Auditorium Apple выпустила в открытое плавание SiriKit. Фактически, появляется новая отрасль разработки, где должны быть свои проектировщики, архитекторы и разработчики. Идеальный момент, чтобы поговорить про голосовые помощники и api для них.

В этой статье не будет подробных туториалов. Это статья об идеях и интересных технических деталях, на которых построены инструменты для сторонних разработчиков основных игроков рынка: Apple Siri, Google Assistant и Алисы от Яндекса.
Читать полностью »

Аутентификация и идентификация по голосу с помощью когнитивных сервисов Microsoft - 1


Когнитивные сервисы представляют доступ к различным облачным сервисам, которые позволяют работать с визуальной, голосовой и текстовой информацией. Кроме того, доступны различные поисковые функции Bing.

Для того, чтобы попробовать когнитивные сервисы в действии даже не обязательно иметь аккаунт Microsoft. Получить пробный ключ можно и с помощью аккаунта GitHub или LinkedIn. Пробная подписка не ограничена по времени, но ограничена по количеству используемых ресурсов за период. Ознакомиться с онлайн демонстрацией можно по адресу: Speaker Recognition API

Далее идет описание того как опробовать в действии аутентификацию пользователя с помощью голоса. Хоть сервис еще и в состоянии preview, но, несмотря на это, уже довольно интересен.
Сервис может быть использован из различных платформ, но я буду рассматривать создание C#/XAML приложения UWP.
Читать полностью »

Русский колл-центр: екатеринбуржский Наумен + SIP-шлюз сборки Новосибирска, результаты - 1
Шлюз отечественного производства (разработка, отладка, поверхностный монтаж)

Привет!

Мы тут протестировали совместную работу контакт-центра отечественного вендора Naumen и голосового транкового шлюза SMG-2 российской компании Eltex. Эти две штуки вместе дают полноценный отечественный колл-центр.

Отличается это решение от других тем, что оно подходит под понятие «импортозамещение». Я, когда слышу это слово, уже дёргаюсь: на рынке сейчас многие просто переклеивают наклейку и пишут документацию на русском. Но тут всё прямо как надо.Читать полностью »

Доброго дня.

Я работаю в компании, которая озвучивает компьютерные игры. Хочу продолжить свой рассказ о создании авторской озвучки для игры World of Tanks. Чтобы было понятнее о чем речь, и откуда что берется, сначала рекомендую ознакомиться с моим предыдущим постом на эту тему.

world_of_tanks_1

Поборов восковые валики, то есть записав альтернативное озвучание для World of Tanks, которые стало быстро набирать популярность среди игроков, я стал думать, чтобы сделать еще такого этакого.

Да, кстати.

Официальная реакция

Мне постоянно задают примерно один и тот же вопрос.

question Читать полностью »

Доброго дня.

Я работаю в студии, которая занимается озвучанием компьютерных игр. Хочу рассказать о том, как мы работали над озвучанием World of Tanks.

World-of-Tanks

Конечно, многие любят рубать в WoT, я и сам потратил там немало времени и денег покупая новые танки и премиум снаряды. Игра классная, спору нет.

Но гоняя на своих танках, самоходках и САУ я всегда задавался одним вопросом.

И наверняка многие из вас задавали себе такой же вопрос:  "Неужели правда озвучку в World of Tanks записывали вот так?"

Работа над авторским озвучанием World of Tanks
Читать полностью »

Всегда отрадно видеть, как западные тренды приходят на родные просторы, а технологии даже идут с опережением. Весь цивилизованный мир давно уже бурлит на тему использования Online Big Data и пользовательского контента социальных сетей, как поля для анализа, выявления трендов и общественных настроений и прогнозирования будущего. Пентагон объявляет тендеры на разработку прогнозной системы, больницы анализируют твиттер для предсказания эпидемий, а некоторые даже предсказывают стихийные бедствия и их последствия, анализируя контент социальных медиа.

Заметив серьёзный интерес Хабра к теме открывающихся на волне роста публичного контента и развития технологий Online Big Data, безграничных возможностей оперативной социологии и прогностики, я решил раскрыть тему подробнее и поделиться с вами практическим примером предсказания результатов финала телепроекта Голос.

Мы проверили, сможет ли Brand Analytics предсказать результаты финала. И можем сказать, что нам это удалось. За несколько часов до финала мы уже не сомневались, как проголосуют телезрители:
Социальные сети как инструмент прогнозирования и оперативной социологии
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js