- PVSM.RU - https://www.pvsm.ru -

Оцифрованы записи переговоров миссий «Аполлон» с центром управления полетами NASA

Группа исследователей оцифровала [1] тысячи часов аудиозаписей из архивов NASA. Это — записи переговоров сотрудников центра управления полетами с астронавтами миссий «Аполлон». C их помощью исследователи надеются усовершенствовать технологии распознавания и анализа речи.

Об этом проекте и сложностях в работе над ним — расскажем под катом.

Оцифрованы записи переговоров миссий «Аполлон» с центром управления полетами NASA - 1 [2]
Фото Salvatore Capalbi [3] CC BY-SA [4]

О проекте

В 2012 году группа исследователей под руководством профессора Джона Хансена (John Hansen) из Техасского университета в Далласе обратилась [5] в NASA с просьбой предоставить им доступ к аудиоархивам агентства. Исследователи хотели использовать записи переговоров астронавтов с центром управления полетами NASA для разработки и обучения алгоритмов распознавания речи.

Доступ исследователям предоставили, однако они столкнулись с неприятной проблемой — оказалось, что большая часть аудиозаписей не была оцифрована и хранилась в архивах NASA на пленках.

Команда решила заняться этим вопросом, дав старт проекту, который продлился больше пяти лет. Ученые начали оцифровывать все записи из космической миссии «Аполлон-11» и большую часть записей из «Аполлона-1» «Аполлона-13» и «Джемини-8».

Задача оцифровки старых пленок оказалась технически сложной. Записи можно было воспроизвести только на специальных аппаратах SoundScriber, которые делались в 1960-е для NASA. Всего в мире существует две таких машины, сделанные специально для агентства.

Установленные в командном центре, аппараты писали на пленку звук из 30 разных источников на 30 отдельных дорожек. Однако до наших дней в рабочем состоянии сохранился [1] лишь один SoundScriber. При этом машина могла воспроизводить только одну дорожку за раз. Учитывая, что на руках у исследователей было бесчисленное количество пленок с записями по 14 часов каждая, то проект мог затянуться на долгое время.

«Даже если заниматься этим круглосуточно, оцифровка архива только для «Аполлона-11» заняла бы у нас примерно 170 лет», — сказал Хансен.

Для решения проблемы ученые модифицировали SoundScriber, разработав новую считывающую головку, которая позволяла читать 30 дорожек одновременно. Плюс было реализовано решение для параллельной их обработки.

В итоге архив всех четырех миссий оцифровали всего за три месяца. Затем исследователи создали программу, которая не только распознавала речь, но и определяла, кто и когда говорил, и размещала записи в хронологическом порядке.

Архив будет общедоступным для других ученых и сотрудников университетов. Часть записей уже есть на сайте Explore Apollo [6], который посвящен миссии «Аполлон-11».

Почему это важно

Одной из главных проблем NLP-систем [7] является задача распознавания речи в зашумленной обстановке — когда говорят сразу множество людей, присутствуют посторонние звуки. Команда исследователей и Джон Хансен надеются, что их работа позволит сделать шаг в перед в её разрешении.

Аудиоархивы NASA — это записи разговоров множества людей одновременно в реальной ситуации, связанной с решением ряда сложнейших задач. Более того, часто у сотрудников центра в Хьюстоне в речи присутствует ярко выраженный техасский акцент, а распознавание [8] разных вариантов произношения — не самая сильная сторона систем ИИ. Использование таких записей для тренировки алгоритмов ML позволит лучше «подготовить» машины для работы в сложных условиях.

Джон Хансен также считает [9], что их труд позволит приоткрыть дверь в мир космических полетов для широкой общественности. Обычно мы видим только работу астронавтов, но упускаем из вида труд людей, которые сопровождают полет с Земли. Эти записи дадут возможность заглянуть в самое сердце NASA. Как говорит Хансен — это шанс узнать о «героях, стоящих за героями».

Оцифрованы записи переговоров миссий «Аполлон» с центром управления полетами NASA - 2
Фото NASA [10]

Другие записи

Ранее в NASA уже публиковали некоторые аудиозаписи из своих архивов. В 2014 на сайте агентства были размещены [11] записи переговоров членов экипажа на борту «Аполлона-11». Все записи приведены в оригинальном виде, с техническими помехами и длинными паузами. Аудио в некоторые моменты оставляет желать лучшего, однако рядом с соответствующими файлами проставлены временные метки, по которым можно свериться с текстовой расшифровкой [12].

Также записи переговоров во время миссий NASA можно найти в официальном архиве агентства на сайте archive.org [13]. Там представлены записи как старых полетов (от 1982 года), так и современных запусков.

Еще в интернете можно найти записи переговоров космонавтов на МКС. Например, на этом ресурсе есть аудиозаписи [14], сделанные во время выхода в открытый космос [15] и решении нештатной ситуации на борту станции [16] в августе 2007 года. Там есть записи, на которых космонавты с борта МКС отвечают на вопросы и рассказывают, как они отдыхают и что выращивают [17].

Все эти архивы и проекты позволяют лучше познакомиться с процессами, происходящими на орбите в космосе и в штабе на Земле.


Больше интересного о звуке — в нашем «Мире Hi-Fi»:


Автор: Audioman

Источник [21]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/rabota-so-zvukom/286460

Ссылки в тексте:

[1] оцифровала: https://www.houstonpublicmedia.org/articles/shows/houston-matters/2018/07/05/294281/what-researchers-found-on-hours-and-hours-of-audio-tapes-from-nasas-apollo-missions-2/

[2] Image: https://habr.com/company/audiomania/blog/417541/

[3] Salvatore Capalbi: https://flic.kr/p/V7EWJX

[4] CC BY-SA: https://creativecommons.org/licenses/by-sa/2.0/

[5] обратилась: https://phys.org/news/2017-12-team-techniques-thousands-hours-nasa.html

[6] Explore Apollo: https://app.exploreapollo.org/

[7] NLP-систем: https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B5%D1%81%D1%82%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D1%8F%D0%B7%D1%8B%D0%BA%D0%B0

[8] распознавание: https://www.economist.com/books-and-arts/2018/02/15/in-the-world-of-voice-recognition-not-all-accents-are-equal

[9] считает: https://soundcloud.com/houstonmatters/hat-researchers-found-on-hours-and-hours-of-audio-tapes-from-nasas-apollo-missions

[10] NASA: https://www.flickr.com/photos/nasacommons/23658364679

[11] были размещены: https://www.nasa.gov/mission_pages/apollo/40th/apollo11_audio.html

[12] свериться с текстовой расшифровкой: https://www.jsc.nasa.gov/history/mission_trans/AS11_CM.PDF

[13] на сайте archive.org: https://archive.org/details/nasaaudiocollection

[14] есть аудиозаписи: http://www.radioscanner.ru/files/mks/

[15] во время выхода в открытый космос: http://www.radioscanner.ru/files/mks/file17784/

[16] решении нештатной ситуации на борту станции: http://www.radioscanner.ru/files/mks/file3542/

[17] рассказывают, как они отдыхают и что выращивают: http://www.radioscanner.ru/files/mks/file3615/

[18] Как считать звук с пачки из-под чипсов, или что такое «визуальный микрофон» : https://www.audiomania.ru/content/art-5595.html

[19] BBC открыла доступ к 16 000 звуковых эффектов из своих архивов: https://www.audiomania.ru/content/art-5838.html

[20] Измеряем количество скрытых ошибок в компакт-диске: https://www.audiomania.ru/content/art-5785.html

[21] Источник: https://habr.com/post/417541/?utm_source=habrahabr&utm_medium=rss&utm_campaign=417541