- PVSM.RU - https://www.pvsm.ru -
Обычно Google translate используют для перевода речи транслируемой микрофоном.
Но в один момент, автору потребовалось перевести подкаст Медузы в текст.
Идея лежала на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate.
Но, гуглением, программы не нашлось, кроме двух сайтов. Которые использовали по уверениям их авторов всю мощь искусственного интеллекта Google.
Первый нашелся русскоязычный сайт https://speechpad.ru/blog/windows-integration/ [1]
Но, как бы не было обидно, магия не сработала...
Был найден англоязычный сайт: https://speechlogger.appspot.com/ru/ [2]
Результат — тот же. Но, было в отличие от предыдущего — объяснение.
Там было показано, как реализовать, казалось бы, простую идею: пустить в качестве сигнала микрофона — аудио файл.
Для этого необходим драйвер VB-CABLE Virtual Audio Device [3] Он OpenSourse.
Искренняя благодарность "прогнившим западным" альтруистам!
Устанавливаем (проверено под Win 10) и настраиваем микрофонный вход в системе, на этот драйвер.
Открываем Gogle translate, нажимаем кнопочку с изображением микрофона и запускаем любой плейер с аудио — файлом.
И — Вааля! Магия работает, на ваших глазах появляются строки текста.
Точность распознавания, на глаз 85-97 %. Но, есть ограничение — 5 тыс. символов, что немало. Поэтому приходиться останавливать запись, копировать текст и продолжать далее.
Заодно происходит перевод на второй выбранный язык. О боже, сколько странных переводов появится!
Дополнение: есть способ без ограничений на количество символов. — это Google Docs, он так-же работает но, только без перевода на второй язык. Спасибо dioneo [4]
Как мне кажется, Google блокирует постоянные подключения с одних IP. Поэтому ценность этого способа — в том, что все IP не заблокируешь и соответственно, этот способ более работоспособен. Тут уже слово разработчикам и большим "гуру", чем автор.
Всем добра и удобства.
Автор: Потапьев Дмитрий
Источник [5]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/google/280593
Ссылки в тексте:
[1] https://speechpad.ru/blog/windows-integration/: https://speechpad.ru/blog/windows-integration/
[2] https://speechlogger.appspot.com/ru/: https://speechlogger.appspot.com/ru/
[3] VB-CABLE Virtual Audio Device: https://www.vb-audio.com/Cable/index.htm
[4] dioneo: https://geektimes.com/users/dioneo/
[5] Источник: https://geektimes.com/post/301057/?utm_campaign=301057
Нажмите здесь для печати.