Рубрика «голосовое управление» - 4

Ubi: избушка, повернись к лесу!

Бытовыми устройствами, подключенными к интернету и связанными между собой, уже никого не удивишь: даже в России можно при желании прикупить термостаты-не-будем-говорить-какой-фирмы, управляемые по воздуху осветительные приборы или установить жалюзи, закрывающиеся тапом по смартфону. На очереди — управление домашним хозяйством с помощью голоса.

В последние годы Apple, Google и Microsoft щедро вкладываются в технологии распознавания речи, поощряя пользователей на все более частое и осмысленное голосовое общение с мобильными девайсами и игровыми консолями. Ubi, устройство, появившееся в продаже в Соединенных Штатах несколько дней назад, придает этой идее новое направление развития — пора попробовать отдавать команды бытовым приборам и системам умного дома (Ubi — от англ. ubiquitous computer, «вездесущий компьютер»).
Читать полностью »


В этой статье я подробно расскажу и покажу, как правильно и быстро прикрутить распознавание русской речи на движке Pocketsphinx (для iOS порт OpenEars) на реальном Hello World примере управления домашней техникой.
Почему именно домашней техникой? Да потому что благодаря такому примеру можно оценить ту скорость и точность, которой можно добиться при использовании полностью локального распознавания речи без серверов типа Google ASR или Яндекс SpeechKit.
К статье я также прилагаю все исходники программы и саму сборку под Android.

Читать полностью »

Здравствуйте, дорогие пользователи хабрахабр!

Наконец-то наступил тот день, когда я решил написать первый пост для Вас.
Речь пойдет о том, как возникла идея создания проекта, на какой стадии развития мы находимся сегодня и какие планы стоят перед нами в самое ближайшее будущее. Смотри видео:

Идея проекта возникла еще в далеком 2009 году, когда я был еще студентом марийского государственного университета. В свое время я мечтал поступить в главный альма матер страны: московский государственный университет имени Михаила Васильевича Ломоносова. Кто знает, наверняка помнит, что первое время там не принимался единый государственный экзамен и необходимо было сдавать все экзамены лично, используя свои знания и навыки. Для этих целей активно готовился более года. Я разработал программу на год, где разделил методичку абитуриента на временные периоды в течение года по дисциплинам. И по ним активно готовился каждый день. Весь мой день был расписан по минутам. Вставал я в 6 часов 30 минут, ложился в 23 00. Благодаря четкой организованности, мне удалось значительно повысить свой внутренний мир.

Читать полностью »

Понедельник, он же почти как пятница, поэтому он тоже достоин веселых новостей. Итак, игровая приставка Xbox One умеет распознавать голосовые команды (причем настолько хорошо, что в некоторых играх игрока могут оштрафовать за мат, но это другая история). Так вот, если рядом с приставкой произнести «Xbox On», она включится. Очень, надо сказать, удобно.

Оказалось, что Xbox One включается, когда слышит свою рекламу по телевизору

Теперь представьте развитие ситуации: вы смотрите телевизор. Во время рекламной паузы на экране появляется Аарон Пол (актер, игравший в «Во все тяжкие»). И, рекламируя приставку, Аарон показывает, как она включается по команде. Угадайте, что произойдет с вашей домашней консолью, которая в это время спит в пол уха? Правильно, она тут же влючится. И будет периодически пытаться это сделать, когда соответствующая реклама будет звучать по телевизору.Читать полностью »

Второй из законов робототехники, сформулированных небезызвестным американским писателем-фантастом Айзеком Азимовым, гласит, что робот должен повиноваться приказам, которые дает человек. Какими способами можно отдавать приказы роботу? Если верить большинству фантастических фильмов, то наиболее комфортным способом общения с роботом является естественная человеческая речь. Именно поэтому мы предоставили роботу Tod, как настоящему слуге человека, долгожданную возможность понимания голосовых команд управления и синтеза речи на русском языке. Теперь достаточно, например, отдать приказ «Робот, езжай на кухню», чтобы робот выполнил необходимую задачу. Под катом мы расскажем подробнее об используемом на роботе ПО для распознания и синтеза речи, а в видеороликах покажем примеры использования голосовых команд.
Вектор развития нашего проекта зависит от мнения хабрасообщества. Заинтересованы ли вы в использовании робота Tod как open source платформы для разработчиков? Пожалуйста, проголосуйте в нашем опросе.
Читать полностью »

— Всё в порядке, Лёня?
Динамики отрегулированы на максимум, я морщусь, отвечаю:
— Да. Тише звук.
— Звук — тише, — соглашается «Виндоус-Хоум», — тише, тише…
— Хватит, Вика
С.Лукьяненко, «Лабиринт отражений»

Введение

В 1997-ом году Лукьяненко пророчил для десктопа сочетание CLI и голосового управления. Однако сейчас голосовое управление — достаточно узкая ниша.
Голосовое управление — взаимодействие с устройством при помощи звуковых команд. Не путайте это понятие с распознаванием речи. Для голосового управления достаточно, чтобы устройство реагировало на единственную нужную команду (ведь ваша собака не может работать машинисткой?). Распознавание речи — гораздо более глобальная проблема: в этом случае устройство должно преобразовывать в текстовый формат все слова, произнесенные вами. Как легко догадаться, распознавание речи на данный момент реализовано поверхностно относительно человеческих возможностей.
Функционал, рассмотренный в статье, может быть применен, к примеру, для организации модного сейчас «умного дома» или просто управления компьютером. Честно говоря, для описания управления компьютером хватило бы пары абзацев, но я попытаюсь показать вам основы работы с CMU Sphinx.
Кстати, процентов 70 описанного здесь подойдет и пользователям Windows.
Читать полностью »

В Мичиганском университете совместно с Adobe Research создали прототип графического редактора, управляемого голосом и жестами. Прототип, названный PixelTone, пока умеет делать лишь самые простые операции и жесты. Он понимает простые команды и ориентируется в описательных терминах вроде «верх», «низ», «ярче», «темнее». Кроме того, он может запоминать названия объектов и имена людей на фотографиях, что позволяет использовать команды вроде «Сделай Васю чуть контрастнее».


Читать полностью »

Кажется, дождались. Персональный мобильный Ассистент Speaktoit научился русскому языку.

Ассистент имеет визуальное представление в виде персонажа (его можно менять) и отвечает на вопросы, заданные ему на естественном языке (текстом или голосом). Ассистент ищет информацию, выполняет задания, а также напоминает о событиях, используя доступную информацию о пользователе. При поиске информации по запросам пользователя и для выполнения задач ассистент взаимодействует с внешними сервисами.

В Google Play он бесплатный.
В AppStore за него хотят $0.99.
Ссылки на приложения в магазинах лежат на сайте производителя.
Обратите внимание, что и в Google Play, и в AppStore есть по два отдельных приложения — на русском и на английском.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js