Рубрика «транскрибация»

Как быстро собрать полезный инструмент: транскрибатор видео с помощью вайб‑кодинга

2026-07-06 в 9:51, admin, рубрики: docx, faster-whisper, ffmpeg, gpt, OpenAI, python, Whisper, локальное приложение, транскрибация, Яндекс Телемост

После рабочих встреч часто остаются записи. В моем случае это записи Яндекс Телемоста.

Запись есть, но пользоваться ей не всегда удобно. Если нужно что‑то вспомнить, приходится открывать видео, перематывать, искать нужный кусок, переслушивать. Если нужно передать встречу другому человеку, одного видео обычно мало.

У меня часто бывает такой сценарий: нужно передать программисту контекст по задаче. Можно скинуть запись встречи и написать: «посмотри, пожалуйста». Но человеку придется самому смотреть видео, искать важные места, понимать, где обсуждение, где решение, где задача.

Читать полностью »

Бесплатная транскрибация любого видео и аудио на ПК с Windows

2026-06-26 в 18:58, admin, рубрики: транскрибация

Это простой способ транскрибации любого аудио или видео. Бесплатно (нужен Windows + Google аккаунт) и без ограничений (подразумевается использования для личных задач на уровне 100 видео в день).

Раньше я пользовался Otter и Descript. Они платные (10–30$/месяц) + есть лимиты — 600 минут в месяц, 90 минут за раз.

Короче, внедряйте и пользуйтесь.

Подготовка

Переходим в папку C:Users[имя пользователя]Downloads или «Загрузки» (где [имя пользователя] это ваш логин, под которым вы входите в Windows).

Например, ваш вариант C:UserspetiaDownloads или C:UserskatiaDownloads

Создаём в папке «Загрузки» папку «audio».

Переходим на Гитхаб проекта Читать полностью »

Голос в текст, текст в перевод: строим десктопное приложение для распознавания речи с Azure Speech SDK и NAudio

2026-05-12 в 9:15, admin, рубрики: .net, avaloniaui, azure speech services, C#, naudio, reactiveui, диаризация, распознавание речи, транскрибация

Предисловие: зачем вообще это нужно

Читать полностью »

Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков

2026-02-24 в 16:15, admin, рубрики: Gradio, llm, open source, python, ryzen, WhisperX, автоматизация, искусственный интеллект, машинное обучение, транскрибация

У многих из нас есть «кладбище» аудиозаписей: интервью, лекции, длинные совещания. Когда мой архив перевалил за сотню часов, я понял, что пора что-то менять. Облачные сервисы либо кусаются по цене, либо выдают «кашу» без нормальной пунктуации и разделения спикеров.

В этой статье я расскажу, как собрал локальный конвейер на базе WhisperX, почему 40 ГБ оперативной памяти важнее мощной видеокарты и как метод «вайб-кодинга» помог мне превратить одиночный скрипт в модульное приложение с пакетной обработкой.

Почему не ванильный Whisper?

Оригинальный Whisper от OpenAI хорош, но для моих задач у него было три фатальных недостатка:

Читать полностью »

Как я решил проблему длинных совещаний вайбкодингом и китайской видеокартой

2026-01-12 в 20:31, admin, рубрики: aliexpress, claude, gpu, ml, nvidia tesla, productmanager, rag, Whisper, вайбкодинг, транскрибация

Еще одна статья про whisper + pyannote для транскрибации совещаний? Да, но нет.

Читать полностью »

Топ-7 нейросетей для транскрибации аудио в текст: обзор лучших AI-моделей для быстрой и точной расшифровки

2025-12-24 в 13:07, admin, рубрики: AI, Anthropic, Google, OpenAI, teamlogs, Whisper, ИИ, нейросеть, транскрибация

Читать полностью »

Эволюция протоколов встреч: от листка в блокноте до ИИ-ассистента

2025-10-25 в 5:17, admin, рубрики: видеовстречи, встречи, запись разговоров, машинное обучение, нейросети, расшифровка, собрания, суммаризация, транскрибация

I. Первые шаги: листок, стенография и диктофон

В середине XX века к протоколированию добавился диктофон. Уже не надо было все ловить «на лету» — можно записать разговор и потом «разложить» записи в текст. Но диктофон имел слабое место: качество записи, шум, шепоты, пересекающиеся голоса — всё это мешало точности. К тому же, никто не может слушать три часа записи без усталости — и всё равно надо вручную транскрибировать, выбирать, что важно.

Но технология, решая одну проблему, тут же создала другую. Часовые записи становились «цифровым кладбищемЧитать полностью »

Топ-5 бесплатных нейросетей для транскрибации: лучшие сервисы для перевода аудио в текст

2025-07-30 в 12:30, admin, рубрики: AI, assembly, audio to text, riverside, teamlogs, Whisper, аудио в текст, ИИ, нейросети, транскрибация

Читать полностью »

Топ моделей для контента

2025-07-25 в 12:13, admin, рубрики: midjourney, ИИ, контент, модели ии, нейросети, создание видео, создание изображений, создание контента, транскрибация

В последние годы генеративные нейросети стали не просто трендом, а полноценным инструментом для создания контента. Текст, изображения, аудио и даже видео — всё это можно сгенерировать с помощью моделей искусственного интеллектаЧитать полностью »

OpenAI взимает оплату поминутно, так что сделаем минуты короче

2025-06-26 в 10:38, admin, рубрики: OpenAI, voice-to-text, транскрибация, транскрипция

Хотите ускорить и удешевить транскрибации OpenAI? Просто повысьте скорость аудио.

Я имею в виду буквально. Перед транскрибацией увеличьте скорость аудио в два или в три раза в Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «транскрибация»

Как быстро собрать полезный инструмент: транскрибатор видео с помощью вайб‑кодинга

Бесплатная транскрибация любого видео и аудио на ПК с Windows

Подготовка

Голос в текст, текст в перевод: строим десктопное приложение для распознавания речи с Azure Speech SDK и NAudio

Предисловие: зачем вообще это нужно

Large-v3 на Ryzen 5500U: как я оцифровал архив диктофонных записей без GPU и облаков

Почему не ванильный Whisper?

Как я решил проблему длинных совещаний вайбкодингом и китайской видеокартой

Топ-7 нейросетей для транскрибации аудио в текст: обзор лучших AI-моделей для быстрой и точной расшифровки

Эволюция протоколов встреч: от листка в блокноте до ИИ-ассистента

I. Первые шаги: листок, стенография и диктофон

Топ-5 бесплатных нейросетей для транскрибации: лучшие сервисы для перевода аудио в текст

Топ моделей для контента

OpenAI взимает оплату поминутно, так что сделаем минуты короче