Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта

в 11:08, , рубрики: claude code, Kilo Code, LM Studio, open source, qwen, бесплатные модели, кодинг, локальная LLM

Иногда нужна языковая модель, которая работает без интернета — на борту самолёта, в закрытом корпоративном контуре и т.д. В других случаях интернет есть, но платить за подписку не хочется. В этой статье — пошаговый разбор двух сценариев: локальный запуск через LM Studio и четыре бесплатных облачных агента, которые работают прямо в IDE.

Статья также доступна в формате видео.

Выбор модели

Для примера буду использовать Qwen3.5 — open source модель от Alibaba. Принципиальной привязки к ней нет: всё, что я покажу дальше, работает с любой другой моделью. Просто сейчас это один из лучших вариантов по соотношению качества и требований к железу.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 1

Модели обычно выпускают серией с разным количеством параметров. Чем больше параметров — тем мощнее железо нужно и тем лучше качество ответов. Последнее время появляются модели, которые вообще можно запустить и на телефоне, но понятно, что и соображают они соответственно. У меня MacBook на M3, на нём со скрипом запускается модель на 35B, а нормально — вариант на 9B параметров.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 2

Чтобы подобрать модель под своё железо, можно воспользоваться сайтом canirun.ai — там можно посмотреть, что вообще существует и что пойдёт на вашем железе.

Перед локальным запуском модель можно проверить в браузере на странице модели на Hugging Face — там же есть inference и бенчмарки. Посмотреть, насколько хорошо она генерирует код (или не код) под ваши задачи.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 3

Локальный запуск: LM Studio

Инструментов для локального запуска моделей много — Ollama, Jan, GPT4All и другие. Я буду использовать LM Studio: удобный интерфейс, встроенный чат для быстрой проверки модели и простой запуск локального сервера. Установка стандартная.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 4

В поиске внутри LM Studio пишем название модели — qwen3.5. Появятся несколько вариантов разного размера. Выбираем под своё железо.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 5

После загрузки запускаем встроенный сервер. Модель поднимается локально по адресу localhost:1234 и отдаёт API, совместимый с OpenAI. Убедиться, что сервер работает, можно запросом в Postman или Connekt (про это у меня есть отдельный гайд):

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 6

Подключаем к IDE через Kilo Code

Kilo Code — open source плагин для ИИ-кодинга, работает в VS Code и во всех JetBrains-based IDE. Буду показывать на OpenIDE — бесплатной российской IDE на базе IntelliJ Platform, поддерживает Java, Python, Go, TypeScript. Если у вас GoLand, PyCharm, IntelliJ IDEA или любая другая JetBrains IDE — всё аналогично.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 7

Устанавливаем плагин Kilo Code из маркетплейса. После установки оставляем дефолтный профиль без изменений и создаём новый — выбираем провайдер LM Studio, указываем адрес localhost:1234 и модель.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 8

Возвращаемся в чат и переключаемся на только что созданный профиль. Теперь агент видит файлы проекта, может редактировать код и запускать команды — и всё это локально, без интернета.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 9

Работает полностью офлайн, без подписки, без лимитов на запросы. Для самолёта или закрытого контура — более менее рабочее решение. Для повседневного использования — честно, очень слабое: скорость генерации зависит от железа, качество уступает передовым моделям. Но маленькие модели становятся лучше с каждым днём. Думаю, как раньше невозможно было представить, что компьютер размером с комнату будет помещаться в кармане джинс, так и сейчас невозможно представить, что ультра маленькая моделька будет настолько же хороша, насколько и облачная (ну или по крайней мере более чем достаточна для повседневных задач).

Бесплатные облачные варианты

Расскажу про четыре. Все бесплатные, все в той или иной степени доступны в РФ и СНГ.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 10

Kilo Code (облачные модели)

Тот же плагин Kilo Code. Помимо подключения своих моделей, он предоставляет бесплатные облачные модели — в том числе новые от крупных провайдеров, которые появляются здесь бесплатно сразу после релиза на какое-то время. Через Kilo Code можно также подключить любого облачного провайдера — OpenRouter, Anthropic, OpenAI — по ценам провайдера без наценки, со своим API-ключом.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 11

Отдельный момент про Anthropic: если у вас есть подписка Claude, Anthropic довольно жёстко относится к её использованию в сторонних инструментах вроде Kilo Code. Можно использовать API-ключ, но передавать данные подписки плагину не стоит — могут заблокировать.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 12

Qwen Code

СLI-агент от Alibaba, аналог Claude Code. 1 000 бесплатных запросов в день без лимита на токены. Устанавливается одной командой.

После авторизации через браузер можно запустить в терминале IDE. Можно также добавить его в Kilo Code как отдельный профиль — указать директорию с данными аутентификации Qwen Code в настройках провайдера. Тогда все агенты оказываются в одном интерфейсе.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 13

OpenCode

Open source агент, 120k+ звёзд на GitHub. Поддерживает большое количество провайдеров, включая локальные модели. Периодически появляются бесплатные модели — MiniMax, MiMo, Nemotron. Подключить к Kilo Code не получится — запускается только в терминале.

OpenAI Codex

На момент написания статьи — временно бесплатен для всех пользователей, в том числе без подписки на ChatGPT, с ограниченным количеством запросов. Есть полноценное приложение для macOS и Windows с поддержкой нескольких параллельных агентов и git worktrees. Для регистрации нужен не-российский IP.

Как и Qwen Code, Codex можно добавить в Kilo Code как отдельный профиль. Такой подход мне нравится тем, что если закончатся запросы у одного агента — можно без проблем переключиться на другой, не выходя из IDE.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 14

Расширенные настройки, MCP-серверы и Skills

В настройках Kilo Code есть раздел Agent Behavior — там можно развлекаться с MCP-серверами, правилами и скиллами. Любой подходящий MCP улучшает результат и экономит токены: вместо того чтобы грепать все файлы, агент сразу запрашивает нужный контекст.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 15

Если пишете на Java или Kotlin со Spring — есть Spring MCP от Amplicode. Агент через него может сразу обращаться к контроллерам, эндпоинтам, репозиториям, не сканируя весь проект вручную. Сейчас в бета-тестировании, доступ по запросу черещ (info@amplicode.ru).

Заключение

Часть из того, что я показал, может очень быстро устареть — бесплатные тарифы закрываются, появляются новые инструменты. Если знаете агентов или связки, про которые я не рассказал, — пишите в комментариях.

Локальная LLM для кодинга за 12 минут: LM Studio, Kilo Code и четыре бесплатных облачных варианта - 16

Уже сейчас OpenIDE позволяет разрабатывать проекты на Java, Spring, Python, Go, JavaScript и TypeScript! А поддержка Docker и 300+ плагинов доступны абсолютно бесплатно в маркетплейсе. Пробуйте российскую IDE в деле и подписывайтесь на нас в Telegram или Max, чтобы не пропустить свежие обновления и полезные материалы.

Автор: honest_niceman

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js