Рубрика «распознавание речи» - 9

В последней версии мобильной операционной системы Android веб-гигант Google сделал большие изменения в том, как ОС интерпретирует твои голосовые команды. Компания сделала систему распознавания голоса, основанную на том, что мы называем нейронной сетью – компьютеризированной обучающей системой, которая ведет себя подобно человеческому мозгу.

Для многих пользователей, говорит Винсент Ванхуск, ученый-исследователь Google, который направлял усилия по разработке сети, результаты были впечатляющими. «Отчасти стало неожиданностью, насколько мы могли улучшить распознавание, просто изменив модель», — говорит он.

Как Google изменил Android при помощи вашего мозгаЧитать полностью »

В Мичиганском университете совместно с Adobe Research создали прототип графического редактора, управляемого голосом и жестами. Прототип, названный PixelTone, пока умеет делать лишь самые простые операции и жесты. Он понимает простые команды и ориентируется в описательных терминах вроде «верх», «низ», «ярче», «темнее». Кроме того, он может запоминать названия объектов и имена людей на фотографиях, что позволяет использовать команды вроде «Сделай Васю чуть контрастнее».


Читать полностью »

Корпорация Добра не перестает удивлять. Уже слышал ранее как на базе разработок гугла можно распознавать речь в текст. В свое время очень сильно интересовался этим вопросом, искал решения (программные и не только). Но достойных продуктов под руку не попадалось. Как уже узнал позже, все подобные системы используются спецслужбами и военными. Но дело сейчас не в этом.

Фишки youtube: распознавание речи (в текст), автоматические субтитры

Обнаружил, что на всех свежих видео появилась кнопка Текст видеоЧитать полностью »

image

Недавно у меня возникла идея написать виртуального бота для общения. И хотя таковые уже существуют — речь пойдет не о приложении. Для претворения замысла в жизнь нужна была библиотека для распознавания голоса, и я стал искать. О результатах поиска далее.
Читать полностью »

Рэй Курцвейл стал техническим директором GoogleРэй Курцвейл — один из самых именитых футурологов и специалистов по искусственному интеллекту. Он занимается технологиями распознавания речи с 70-х годов прошлого века. Он создал несколько успешных компаний, основанных не технологиях искусственного интеллекта, а в 90-е увлёкся футурологией и написал несколько книг, ставших бестселлерами — «Эпоха мыслящих машин», «Эпоха духовных машин», «Сингулярность уже близка». Курцвейл активно занимается обоснованием наступления технологической сингулярности.
Читать полностью »

Под натиском информационных технологий абсолютно привычные и понятные вещи начинают забываться и приходить в упадок. Думаю, все помнят часы, проведенные над прописью, в попытках вывести ровные контуры букв. Многие педагоги старой советской школы считают, что слитное письмо развивает мелкую моторику и, как следствие, интеллект. Но правительство США решило по-другому: с прошлого года пропись стала необязательным предметом и школы могут принимать работы учеников, написанные печатными буквами: школьники будут писать лишь печатными буквами. Давайте постараемся разобраться, почему это произошло и как современные технологии поддерживают печатные буквы.
Умрет ли слитное письмо?
Читать полностью »

IBM Watson составит конкуренцию SiriСуперкомпьютер IBM Watson уже успел прославиться тем, что обыграл чемпионов телевикторины Jeopardy. Учитывая, что эта викторина известна в России как «Своя Игра», в каком-то смысле Watson не глупее Анатолия Вассермана. Основное назначение суперкомпьютера — аналитика в финансовой и медицинской сфере. Вице-президент IBM по инновациям Берни Майерсон заявил на прошлой неделе, что в планах корпорации — вывести Watson на потребительский рынок, научив его понимать устную речь и снабдив общеупотребительными знаниями. Таким образом, Watson можно будет использовать с помощью мобильного приложения, так же как и Siri.
Читать полностью »

Приветствую всех читателей habrahabr!

В последнее время наблюдается значительный рост интереса к технологиям, связанным с распознаванием речи. Можно назвать несколько причин этого роста, в частности, значительное рост вычислительных возможностей и обучающего материала. На хабрахаре пользователем domage был опубликован целый цикл статей по основам технологий распознавания речи. Также стоит отметить статью Мел-кепстральные коэффициенты (MFCC) и распознавание речи и выполненную на её основе работу по идентификации человека по голосу: Кто там? — Идентификация человека по голосу.
В данной работе предлагается простой алгоритм (и его реализация на C++) системы распознавания речи по короткому словарю, основанный на анализе статистического распределения мел-кепстральных коэффициентов (Mel-frequency cepstrum coefficients, MFCC).
Читать полностью »

image
В этой статье я хочу рассказать о том, как можно распознавать речь на микроконтроллере, используя отладочную плату STM32F4-Discovery. Поскольку распознавание речи — достаточно сложная задача даже для компьютера, то в данном случае оно проводится при помощи сервиса Google. Распознавание речи таким способом может пригодится в разных задачах, например в одном из устройств «умного дома».
Читать полностью »

Приветствуем Вас уважаемые!

Чем больше мы размышляем над будущим наших услуг, тем больше хочется мечтать о колонизации космоса и искусственном интеллекте. Все большие шаги делаются в сторону Марса и небольшие шаги, типа интерфейса Siri от Apple делаются в сторону ИИ.

Поэтому, несомненно, вся IT-индустрия будет двигаться именно в данном ключе, хоть и в нашей области хостинга консерватизм и надежность должны быть на первом месте.

Одним словом, будем стараться разбавлять «конкретные» статьи, статьями наполненными капелькой «мечты».

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js