- PVSM.RU - https://www.pvsm.ru -

Группа Clarity Lab [1], находящаяся в университете Мичигана, предлагает решение с открытым исходным кодом для персонального компьютерного помощника. Их программа распознаёт голос и ищет ответы на запросы, точно как делают Siri от Apple, Google Now от Google, и аналогичные решения от Microsoft и Amazon. Проект под названием Sirius умеет даже больше, чем его аналоги – например, ему можно предоставить картинку и задать по ней вопрос.
Проект спонсируют Google, DARPA, американские военные и Национальный научный фонд США. Он распространяется по лицензии BSD [2], что означает полную открытость и бесплатность для всех желающих. Значит, любые стартапы смогут реализовать такую функциональность в своих проектах и устройствах.

Принцип работы системы
Но для этого им придётся разобраться в довольно сложной системе, из которой состоит проект, выложенный на GitHub [3]. Пока это связка из нескольких отдельных программ – Sphinx [4], Kaldi, Protobuf, Speeded Up Robust Features (SURF [5], работает на базе OpenCV). На конференции ASPLOS 2015 разработчики представят как свою научную работу, посвящённую проекту, так и тьюториал [6]по установке и работе с ним.
Среди энтузиастов уже были попытки создать аналог Siri – это, например, JuliusJS [7], библиотека для распознавания речи. Но пока заметных результатов от этих проектов не видно.
Автор: SLY_G
Источник [8]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/google/85634
Ссылки в тексте:
[1] Clarity Lab: http://clarity-lab.org/
[2] лицензии BSD: https://ru.wikipedia.org/wiki/Лицензия_BSD
[3] выложенный на GitHub: https://github.com/jhauswald/sirius
[4] Sphinx: http://cmusphinx.sourceforge.net/
[5] SURF: http://docs.opencv.org/modules/nonfree/doc/feature_detection.html#surf
[6] тьюториал : http://sirius.clarity-lab.org/tutorial/
[7] JuliusJS: https://github.com/zzmp/juliusjs
[8] Источник: http://geektimes.ru/post/247150/
Нажмите здесь для печати.