- PVSM.RU - https://www.pvsm.ru -
Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.
Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.

Итак, немецкие ученые из двух университетов Мюнхена создали [1] базу аудизаписей, где записа речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах [2] на Вики) Alcohol Language Corpus (ALC).
Корпус предполагается использовать для машинного обучения, чтобы автоматизационные системы (к примеру, в автомобиле) автоматически распознавали состояние хозяина и блокировали управление. Таким образом предполагается бороться с бессовестным человеческим фактором.
До этого несколько автомобильных концернов работали над детектированием пьяного поведения. Но тогда речь шла либо о датчиках, улавливающих пары алкоголя (и иногда ложно срабатывающих при присутствии пьяного пассажира), анализа пота на рукоятке переключения скоростей, или камер, пристально вглядывающихся в лицо водителя. Но, судя по всему, до анализа речи никто пока не додумался.
Стоимость набора записей — порядка $1200 (внушительная сумма за 162 структурированные речи немецких алкоголиков :)
Кстати, вот пример [3] из базы.
Новость закончена, можете ставить минус за краткость.
Автор: Maslukhin
Источник [4]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/data-mining/76437
Ссылки в тексте:
[1] создали: http://www.fastcompany.com/3038889/difficult-conversations/inside-the-first-audio-library-of-alcohol-addled-speech-which-just-m
[2] статья о корпусах: https://ru.wikipedia.org/wiki/%CA%EE%F0%EF%F3%F1%ED%E0%FF_%EB%E8%ED%E3%E2%E8%F1%F2%E8%EA%E0
[3] вот пример: https://soundcloud.com/fast-company/drunk-speaker-example
[4] Источник: http://habrahabr.ru/post/245125/
Нажмите здесь для печати.