Рубрика «локальные модели»

Как за один вечер разгрести 36 000 фотографий и почту с 2005 года, руками AI-агента и локальных моделей

2026-06-14 в 8:48, admin, рубрики: CLIP, czkawka, insightface, mlx, Qwen2.5-VL, дедупликация, диаризация, локальные модели, распознавание лиц

Есть задачи, которые не делаются никогда. Не потому что сложные, а потому что объём убивает любое намерение на втором часу. У меня такой задачей был фотоархив: около 36 000 фото и видео, 222 ГБ, копившиеся 20 лет и размазанные вообще везде:

часть в OneDrive, разложенная по годам;
часть там же, но в свалках: дампы с телефонов, выгрузки из WhatsApp, папка буквально с названием «разобрать старые фото», которая ждала своего часа лет десять;
часть уже в Apple Photos, с iPhone, сама по себе и никак не связанная с остальным архивом;
Читать полностью »

Вам продают ИИ. Покупать нужно не его

2026-05-21 в 13:34, admin, рубрики: data engineering, llm, rag, архитектура данных, внедрение ии, искусственный интеллект, локальные модели, хранилища данных, цена ошибки, эмбеддинги

Звонил мне на днях один знакомый CIO. Питерский, ритейл, средний бизнес, ничего особенного. Слушай, говорит, надо нам с ИИ что‑то делать: все вокруг внедряют, конкуренты вон что‑то запустили, на отраслевом Data Summit уши прожужжали, а у меня даже плана нет. И денег, кстати, особо на это не выделили, но не суть.

Это был, кажется, пятый такой звонок за месяц.

Читать полностью »

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

2026-04-22 в 9:30, admin, рубрики: ai-ассистент, llama.cpp, llm, LM Studio, opencode, qwen, rtx 4070, искусственный интеллект, локальные модели

Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезает в видеопамять. Всё изменилось когда я наткнулся на статью про MoE-модели и параметр -cmoe в llama.cpp.

Расскажу как я запустил Qwen3.6 35B-A3B на RTX 4070 12GB с 32GB RAM, настроил его как AI-ассистент для реального проекта в opencode, и почему теперь эта модель у меня работает постоянно.

Железо и ожидания

Моя конфигурация:

GPU: RTX 4070 12GB VRAM
RAM: 32GB DDR4
CPU: 12 физических ядер
OS: Windows 11 + WSL2 (Ubuntu)

Читать полностью »

Как установить DeepSeek на сервере: практическое руководство

2026-03-24 в 8:07, admin, рубрики: AI, deepseek, selectel, локальные модели, сервер

Читать полностью »

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

2026-02-09 в 17:31, admin, рубрики: ai-агенты, chromadb, llama, llm, rag, redis, векторный поиск, локальные модели

Три месяца назад я наблюдал, как мой агент на Llama 3.1 8B в третий раз спрашивает, как меня зовут.

Я представился в первом сообщении. Двести сообщений назад...

Агент забыл. Не потому что тупой. Потому что контекст переполнился и начало разговора уехало в никуда.

Это был момент, когда я понял: мы неправильно думаем о памяти.

Почему большие контексты — это ловушка

Когда вышел Claude с контекстом на миллион токенов, казалось — проблема решена. Запихиваем всё в контекст, модель помнит всё. Красота.

Потом пришёл счёт за API.

Читать полностью »

OpenCode + Docker Model Runner для локальной разработки с ИИ

2026-01-25 в 8:49, admin, рубрики: devops, llm, runner, локальные модели, разработка

Команда AI for Devs подготовила перевод статьи о том, как использовать OpenCode вместе с Docker Model Runner для локальной разработки с LLM. В центре внимания — контроль над кодом, данными и затратами: модели запускаются локально, контекст не уходит во внешние сервисы, а ИИ-ассистент становится частью вашей инфраструктуры, а не сторонним SaaS. Практический разбор для тех, кто хочет использовать ИИ в разработке без компромиссов по безопасности и стоимости.

Читать полностью »

Парадокс безопасности локальных LLM

2025-10-25 в 13:04, admin, рубрики: eval, exec, llm, атаки, безопасность, бекдор, локальные модели, приватность, разработка

Команда AI for Devs подготовила перевод исследования о парадоксе безопасности локальных LLM. Если вы запускаете модели на своём сервере ради приватности, эту статью стоит прочитать. Эксперименты показывают: локальные модели вроде gpt-oss-20b куда легче обмануть, чем облачные аналоги. Они чаще вставляют вредоносный код, не замечая подвоха, и превращаются в идеальную цель для атак.

Если вы запускаете локальную LLM ради приватности и безопасности, эта статья must have. Наше исследование модели gpt-oss-20b (в рамках Red-Teaming Challenge от OpenAI Читать полностью »

Локальные LLM модели: обзор и тестирование

2025-09-14 в 21:39, admin, рубрики: deepseek, gemma, llm, Ollama, qwen, генерация кода, искусственный интеллект, локальные модели, машинное обучение, нейросети

В ★5УГЛОВ мы часто работаем с языковыми моделями — как облачными, так и локальными. И если про онлайн-сервисы знают все, то локальные LLM до сих пор остаются недооцененным инструментом. Я решил поделиться личным опытом: какие модели можно запускать прямо на ПК, чем они полезны и зачем их вообще использовать в реальных проектах.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «локальные модели»

Как за один вечер разгрести 36 000 фотографий и почту с 2005 года, руками AI-агента и локальных моделей

Вам продают ИИ. Покупать нужно не его

Запускаем Qwen3.6 35B-A3B + opencode локально на RTX 4070 12GB — AI-ассистент для разработки без облака

Железо и ожидания

Как установить DeepSeek на сервере: практическое руководство

Мой локальный агент помнит проект лучше меня. Контекст — 32K токенов. Расскажу, как

Почему большие контексты — это ловушка

OpenCode + Docker Model Runner для локальной разработки с ИИ

Парадокс безопасности локальных LLM

Локальные LLM модели: обзор и тестирование