Рубрика «qwen»

ИИ снова закрывается: почему нейросети оказались на грани блокировок

2026-07-08 в 11:00, admin, рубрики: AI, alibaba, claude, claude mythos, DouBao, glm, llm-модели, qwen, selectel, искусственный интеллект

Читать полностью »

Кнопка «К началу ответа» для ChatGPT, Qwen, DeepSeek, Claude, Gemini, Grok и Perplexity: как я победил скролл и AI‑мысли

2026-06-29 в 11:24, admin, рубрики: chatgpt, claude, deepseek, dom, gemini, javascript, perplexity, qwen, tampermonkey, userscript

Спойлер: коды готовы — вставьте и пользуйтесь.

Логотипы ChatGPT, DeepSeek, Qwen и кнопка — Пример кнопки. Логотипы являются товарными знаками компаний.

Читать полностью »

Погружаем модели в сказки русские, да рассказы древние – тестируем возможности Qwen и Whisper на дореволюционномъ

2026-06-24 в 12:01, admin, рубрики: asr, qwen, selectel, Whisper, автоматическое распознавание речи, искусственный интеллект, распознавание речи, тестирование моделей, транскрибация речи

Читать полностью »

Tesla v100 SXM2 X2 32GB total

2026-06-05 в 8:38, admin, рубрики: 2017, qwen, qwen3.6, SXM2, Tesla V100, V100

Можно ли запустить современную 27-миллиардную модель и полноценного автономного агента на паре серверных ускорителей 2017 года, установленных в обычный десктоп через переходники? Короткий ответ — да, но с оговорками, которые важно знать заранее.

В этом материале я разбираю практический кейс: развёртывание Qwen3.6-27B на двух Tesla V100-SXM2-16GB под управлением автономного агента HermesЧитать полностью »

Почему маленькие модели побеждают большие – и что это значит для вашего стека

2026-06-04 в 10:25, admin, рубрики: claude mythos, gpt-5-mini, llm, qwen, rag, RLM, архитектура ии-моделей, ии-оркестрация

Читать полностью »

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

2026-06-04 в 8:00, admin, рубрики: AI, ai-агенты, deepseek, gpt-oss, llm-модели, mistral, mlops, phi-4, qwen, selectel

Читать полностью »

ИИ‑спасатель в кармане: как мы сделали агента для помощи при ЧС, который работает без интернета

2026-05-23 в 7:30, admin, рубрики: flutter, GigaChat, qwen, ии-агенты, Сбер

Предыстория

Представьте: вы в офисе, срабатывает пожарная сигнализация. Что вы делаете?

Идёте к эвакуационному плану на стене? Пытаетесь вспомнить, что показывали на последнем инструктаже? Или просто идёте за толпой, надеясь, что все знают, куда бежать?

Наша команда столкнулись с этим вопросом, когда начала работать над проектом для «Просоюза», профсоюзной организации «Сбера». Задача звучала просто: «Помочь людям не растеряться в чрезвычайной ситуации». Но когда мы начали погружаться в тему, оказалось, что не всё так однозначно.

Как это работает сейчас?

Читать полностью »

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t-s до 130 t-s без потерь. Что такое MTP

2026-05-18 в 2:28, admin, рубрики: llama.cpp, mtp, qwen, qwen3.6, искусственный интеллект

Читать полностью »

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

2026-05-11 в 14:18, admin, рубрики: gemma4, llama.cpp, llm, llm-модели, opencode, qwen, qwen3.6

Gemma 4 обыграла Qwen Coder в задачах программирования, а режим мышления заставил модели хуже следовать инструкциям. Рассказываю почему.

Зачем я это затеял

Привет, меня зовут Вячеслав. Я интересуюсь локальными LLM и тем, как они ведут себя в реальных задачах — не на синтетических бенчмарках, а когда нужно написать работающий код, отрефакторить файл с багами или вытащить данные из HTML.

Читать полностью »

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM

2026-05-08 в 14:27, admin, рубрики: devops, Fine-tuning, llm, Ollama, OpenClaw, python, qwen

Я работаю по ИП, поэтому не только пишу код, но и поддерживаю как DevOps свои проекты у заказчика. Эта история началась банально: я собирался в отпуск и хотел оптимизировать часть процессов, которые в повседневной жизни занимают время — чтобы не дёргать клиентов из-за вопросов по ошибкам, которые я мог не увидеть во время отдыха. Пусть локальная моделька сама разгребает типовое. Думал: запущу OpenClaw, подключу к локальной модели — и поеду спокойно

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «qwen»

ИИ снова закрывается: почему нейросети оказались на грани блокировок

Кнопка «К началу ответа» для ChatGPT, Qwen, DeepSeek, Claude, Gemini, Grok и Perplexity: как я победил скролл и AI‑мысли

Погружаем модели в сказки русские, да рассказы древние – тестируем возможности Qwen и Whisper на дореволюционномъ

Tesla v100 SXM2 X2 32GB total

Почему маленькие модели побеждают большие – и что это значит для вашего стека

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

ИИ‑спасатель в кармане: как мы сделали агента для помощи при ЧС, который работает без интернета

Предыстория

Как это работает сейчас?

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t-s до 130 t-s без потерь. Что такое MTP

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

Зачем я это затеял

Хотел упростить мониторинг проектов и в отпуск — пришлось обучать свой LLM