Рубрика «llm-архитектура»
Я «уволил» LLM с должности «мозга» проекта. И его производительность взлетела
2025-10-08 в 19:03, admin, рубрики: AI, ai-агенты, ai-ассистент, AI-инструменты, AI-разработка, llm, llm-агент, llm-архитектура, llm-модели
(...или почему будущее AI — не в увеличении контекстного окна, а в создании структурированной "памяти")
Помните свой первый "вау-эффект" от LLM?
Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1
2025-10-01 в 9:00, admin, рубрики: AI, data, llm, llm-агент, llm-архитектура, llm-модели, ml, искусственный интеллект, разработкаЧто будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».
Разбираемся с суффиксами квантования LLM: что на самом деле значат Q4_K_M, Q6_K и Q8_0
2025-06-16 в 17:15, admin, рубрики: AI, llm, llm-архитектура, llm-модели, llm-приложения, ml, ИИ, ИИ и машинное обучение, искусственный интеллект, квантование
Привет!
Читать полностью »
Как все рынки мира оказались уязвимы конкуренции с любым умным айтишником
2025-05-26 в 4:05, admin, рубрики: llm, llm-архитектура, llm-приложения, MCP, mcp-server, ии-агенты, Мультиагентная система, мультиагентные системы, продукт, фрилансистория о том, как в текущем моменте истории, по сути любой разработчик может в одиночку задизраптить любой вертикальный рынок и даже отрасль
Новая революция и ее предпосылки
Помимо самого ИИ, который как снег на голову, мы находимся на пороге беспрецедентного передела рынков в бизнесе.
Традиционная корреляция между успехом стартапа и созданием рабочих мест ослабевает с каждым днем. AI-native компании будут достигать соответствия продукта рынку (Product Market Fit) быстро с одним основателем, но с более высоким уровнем автоматизации, чем когда-либо прежде. Ок, это про стартапы.
Часть 4. Обзор технологий RAG для LLM: аугментация извлеченных данных
2025-05-16 в 20:29, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, rag pipeline, retrieval, retrieval augmented generation, языковые моделиПродолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (ссылка на первую часть — здесь, на вторую часть — здесь, третью часть — здесь). В этой, четвертой части авторы совсем скромненько, словно тренировались заполнять налоговую декларацию, разбирают технологии аугментации извлеченных данных.
Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации
2025-04-21 в 20:23, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, terminology, языковые моделиПродолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.
Сравнение low-code редакторов для разработки приложений на основе LLM
2025-04-06 в 14:19, admin, рубрики: Dify, flowise, langflow, llm, llm-архитектура, llm-модели, llm-приложения, low-code, n8n, ии-агентыПривет, Habr! Наша команда LLM-разработки подготовила статью с анализом low-code редакторов для разработки пайплайнов на базе LLM-моделей. Тема сравнения пайплайнов назревала давно, так как мы активно используем данные редакторы в своей работе и зачастую сталкиваемся с различными ограничениями решений. Данная статья будет полезна командам, которые только выбирают среду разработки пайплайнов для своих LLM-приложений и ИИ-агентов, а также тем, кто ищет лучший редактор для решения своих задач.
Введение
Зачем бизнесу LLM: стратегический взгляд
2025-03-21 в 7:21, admin, рубрики: llm-архитектура, llm-приложения, Внедрение, ИИ, ии чат-бот, ии-ассистент, инновации, Стратегия, экономия
Введение: почему LLM — ваш следующий стратегический шаг
Знакомо: «Давай что-нибудь уже сделаем с этими LLM»? Согласно исследованию McKinsey, 78% руководителей рассматривают ИИ как стратегический актив, но лишь 17% знают, как его внедрить.
→ McKinsey The state of AI, март 2025
Болевые точки бизнеса
Как научить модель рассуждать, не переобучая её, меньше чем за 10$
2025-02-13 в 19:33, admin, рубрики: llm, llm-архитектура, llm-моделиВведение
Это статья обобщение моего исследования передачи знаний от большой модели с замороженными весами в малую модель, которую мы будем обучать через расширенный механизм кросс внимания или проще говоря через LLM модули. Оригинальное исследование доступно по ссылке: arxiv.org/abs/2502.08213 . Репозиторий с кодом и весами доступен на Hugging Face: LLM модули.

