Главная

Рубрика «gemma-3»

Эксперимент по подстройке Gemma 3 для вызова процедур

2026-01-09 в 16:51, admin, рубрики: gemma-3, llm, qlora, сезон ии в разработке

Мне стало интересно, сколько это займет по времени и какие ресурсы потребует. Модель мультимодальная и довольно большая. Подстройка выполняется только в текстовой части.

Далее термины “подстройка” или “тюнинг” взаимозаменяемы. Транслитерированные из английского термины плохо образуют формы слова. Возьмем задачу для примера. Пусть есть агент на базе Gemma-3-4b-it, и нам нужно сделать так, чтобы модель выдавала вызов процедуры, если во входном промте имеется смысл обращения к конфиденциальному функционалу агента, например - активен ли мой доступ, какие последние транзакции и т.п.

Полный Читать полностью »

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

2025-11-16 в 6:31, admin, рубрики: gemma-3, llm, ocr, paddleocr, qwen3, vlm, мультимодальные модели, распознавание текста

Привет! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе.

Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

Читать полностью »

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

2025-06-23 в 10:39, admin, рубрики: AI, gemma-3, gemma-3-12b, llm, LM Studio, mac, MacOS, инструкция, установка, языковая модель

Недавно решил покопаться в локальных языковых моделях и наткнулся на новинку от Google DeepMind — Gemma 3 12B. Модель мощная, с открытой лицензией и, что особенно порадовало, спокойно запускается прямо на ноутбуке. Без серверов, клаудов и трат на аренду GPU.

Чтобы всё это заработало без плясок с настройками, я взял LM Studio — простой и удобный интерфейс для работы с LLM, который буквально делает «запустил и поехали».

Я написал этот материал для блога MinervasoftЧитать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «gemma-3»

Эксперимент по подстройке Gemma 3 для вызова процедур

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций