Главная

Рубрика «speaker verification»

Speaker Recognition. Как искать человека по голосу

2025-06-25 в 15:45, admin, рубрики: artifical neural networks, artificial intelligence, machinelearning, metric learning, speaker identification, speaker verification

Приветствую! В этой статье мы поговорим про задачу Speaker Recognition. О том, как работает такая система, как мы ее оцениваем. И хотя речь пойдет про распознавание человека по голосу, этот же концепт можно использовать и для других биометрических систем, в частности, распознавание лиц.

Metric Learning

В основе такой системы лежит ML-модель (как правило, нейроночка), которая принимает на вход участок голоса и выдает вектор-признак голоса (feature vector или voice embedding). Причем участок голоса может быть как фиксированной длины, так и динамической. Это в большей степени зависит от архитектуры модели, а также от датасета.

Читать полностью »

Вы еще не договорили слово “привет”, а мы уже знаем, кто вы

2018-09-07 в 15:21, admin, рубрики: facenet, features processing, speaker verification, speech processing, triplet loss, Алгоритмы, Блог компании Neurodata Lab, голос, звук, машинное обучение, Научно-популярное, сверточные нейронные сети, спектрограмма

Это может делать наша нейросеть, распознающая человека по одному произнесенному слогу. Однако тема этой статьи не касается напрямую идентификации по голосу, хотя и будет связана с ней. Мы расскажем о нейросетевых фичах, так называемых d-vector, которые можно использовать в задачах обработки звука: от верификации до распознавания речи и эмоций.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «speaker verification»

Speaker Recognition. Как искать человека по голосу

Metric Learning

Вы еще не договорили слово “привет”, а мы уже знаем, кто вы