Рубрика «ffmpeg»

Как я превратил Real‑ESRGAN и FFmpeg в потоковый Windows‑апскейлер без гигантских временных папок

2026-07-15 в 14:06, admin, рубрики: dotnet, ffmpeg, open source, realesrgan, upscaling, wpf

Апскейлить одно изображение с помощью Real‑ESRGAN несложно: передать файл модели, дождаться обработки и сохранить результат. С видео всё становится заметно интереснее.

Нужно декодировать тысячи кадров, передать их нейросети, собрать обратно в видеопоток, сохранить звук, показать пользователю прогресс и корректно остановить несколько одновременно работающих процессов. А если десятичасовой рендер оборвался на девятом часу, желательно не начинать всё сначала.

Именно из этой задачи вырос UltraFrame AI — бесплатное Windows‑приложение с открытым исходным кодом для пакетного апскейлинга видео и изображений.

Читать полностью »

Как быстро собрать полезный инструмент: транскрибатор видео с помощью вайб‑кодинга

2026-07-06 в 9:51, admin, рубрики: docx, faster-whisper, ffmpeg, gpt, OpenAI, python, Whisper, локальное приложение, транскрибация, Яндекс Телемост

После рабочих встреч часто остаются записи. В моем случае это записи Яндекс Телемоста.

Запись есть, но пользоваться ей не всегда удобно. Если нужно что‑то вспомнить, приходится открывать видео, перематывать, искать нужный кусок, переслушивать. Если нужно передать встречу другому человеку, одного видео обычно мало.

У меня часто бывает такой сценарий: нужно передать программисту контекст по задаче. Можно скинуть запись встречи и написать: «посмотри, пожалуйста». Но человеку придется самому смотреть видео, искать важные места, понимать, где обсуждение, где решение, где задача.

Читать полностью »

Зачем мне фото- и видеоредакторы с GUI, когда есть FFmpeg?

2026-05-31 в 9:00, admin, рубрики: cli, ffmpeg, libav, кодек, командная строка, хоткеи

День 1. "Мне больше не придётся крякать Фотошоп и Вегас!".
День 2. Научился блюрить лица и айпишники через командную строку.
День 4. Провёл сравнительное тестирование аппаратных и программных видеокодеков.
День 8. Натравил ИИ-агентов на задачу по монтажу видео.
День 16. Объясняю жене, почему не могу просто запустить Paint и нажать две кнопки.

В последнее время моя работа во многом сосредоточена на вопросах Remote Desktop и стриминга медиа в реальном времени. Я часто использую FFmpeg в работе - и со временем всё чаще и чаще.

Читать полностью »

Нейросетевой апскейлинг: как собрать все грабли и почему очевидные настройки всё портят

2026-05-29 в 6:01, admin, рубрики: ffmpeg, tensorrt, апскейлинг, нейросети, цветовое пространство

В своих прошлых статьях «Три пути к 4K» и Читать полностью »

AGC или как перестать подстраивать громкость вручную

2026-04-12 в 7:16, admin, рубрики: AGC, ffmpeg, Алгоритмы, ару, звук

Предисловие

Я не являюсь профессиональным DSP разработчиком, моя стезя — системное программирование и разработках встраиваемых систем, в частности, специальных систем связи для работы с VoIP. Данная статья рассчитана на тех, кому интересны алгоритмы обработки звука и кто начинает свой путь в их изучении. Здесь я хочу описать свой путь в исследовании и реализации одного из алгоритмов. На Хабре уже выходили статьи на данную тему. Читать полностью »

Я устал настраивать ПК и написал свое приложение для Windows на Flutter

2026-04-04 в 6:26, admin, рубрики: ffmpeg, flutter, open source, pet-project, python, windows, автоматизация, скрипты

Привет. Меня зовут Никита.

Наверняка многим знакома ситуация: кто‑то из друзей или родственников просит «почистить комп», «передалать PNG в JPG» или «раскидать свалку файлов в загрузках».

В какой‑то момент мне это надоело и я решил обернуть все свои рутинные скрипты в удобный графический интерфейс. Чтобы можно было просто скинуть человеку один.exe файл, и всё работало из коробки. Никаких установок питона, никаких консолей.

Так появился мое приложение SmartLauncher

Читать полностью »

Видеонаблюдение на Go с потоковой передачей в Telegram

2026-03-19 в 20:37, admin, рубрики: ffmpeg, Go, telegram, видеонаблюдение

Привет всем! Хочу поделиться небольшим личным проектом, который родился из чистой бытовой необходимости. Я давно хотел иметь возможность удаленно поглядывать на свою дачу, особенно когда уезжаю на несколько недель. Готовые решения в духе "умных камер" меня не совсем устраивают: то подписки дорогие, то Privacy Policy сомнительная, то функционал избыточный. В итоге я решил, что проще и надежнее будет написать свою собственную утилиту.

Идея проста: Читать полностью »

Прямая трансляция во Flutter через WebCodecs: как пришлось написать свой декодер

2026-03-15 в 12:16, admin, рубрики: ffi, ffmpeg, flutter, h264, WebCodecs

Читать полностью »

Qwen3-ASR-Toolkit: бесплатный инструмент для транскрипции аудио любой длительности

2025-09-21 в 15:18, admin, рубрики: api, asr, cli, ffmpeg, python, qwen3, speech-to-text, распознавание речи, транскрибирование

Команда Alibaba Cloud выпустила Qwen3-ASR-Toolkit — открытый инструмент для транскрипции аудио- и видеофайлов любой длительности. Решение построено на базе модели Qwen3-ASRЧитать полностью »

MP3 устарел. Будущее за современными lossless-кодеками

2025-04-28 в 9:01, admin, рубрики: ANS, Apple LZFSE, aptX Lossless, Dropbox DivANS, ffmpeg, flac, FSE, Google Draco 3D, HAVAC, JPEG XL, lossless, lpc, Monkeys Audio, mp3, Nvidia nvCOMP, OptimFROG, RFC 8478, ruvds_статьи, WavPack, арифметическое кодирование, аудиокодеки, коды Голомба, предсказательное кодирование, теорема Шеннона, энтропийное кодирование, Ярек Дуда

Сравнение производительности lossless-кодеков на материале CD-качества, то есть аудиофайлах PCM с битовой глубиной 16 бит и частотой дискретизации 44,1 кГц, источник

В своё время MP3 совершил революцию в распространении музыки. Больше не нужно было покупать дорогие компакт-диски. Достаточно поставить на ночь загрузку из «Напстера» — и к утру у тебя несколько файлов MP3, которые можно слушать совершенно бесплатно! Любые исполнители и альбомы. Это было невероятно.

Но сейчас времена изменились. Файлы скачиваются за секунды, а место на диске измеряется терабайтами. Нет смысла подвергать музыку калечащему сжатию с потерей информации. Можно спокойно скачивать и хранить её в lossless-форматах, причём со значительным сжатием.

Есть ряд lossless-кодеков, которые эффективнее .FLAC по степени сжатия.Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «ffmpeg»

Как я превратил Real‑ESRGAN и FFmpeg в потоковый Windows‑апскейлер без гигантских временных папок

Как быстро собрать полезный инструмент: транскрибатор видео с помощью вайб‑кодинга

Зачем мне фото- и видеоредакторы с GUI, когда есть FFmpeg?

Нейросетевой апскейлинг: как собрать все грабли и почему очевидные настройки всё портят

AGC или как перестать подстраивать громкость вручную

Предисловие

Я устал настраивать ПК и написал свое приложение для Windows на Flutter

Видеонаблюдение на Go с потоковой передачей в Telegram

Прямая трансляция во Flutter через WebCodecs: как пришлось написать свой декодер

Qwen3-ASR-Toolkit: бесплатный инструмент для транскрипции аудио любой длительности

MP3 устарел. Будущее за современными lossless-кодеками