Мне нужен был голосовой ввод. Не встроенная в ОС диктовка, не облачный API — а простая и главное локальная штука: зажал клавишу, сказал, отпустил, текст появился в активном окне.
Готовых решений, которые бы устроили, сходу не нашёл. Сделал свое. Может, кому будет полезно.
Как устроено
Микрофон → Whisper (локально) → LLM-трансформация (опционально) → вставка в активное окно

