Рубрика «large language models»

Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

2026-03-20 в 7:16, admin, рубрики: AI, artificial intelligence, graph database, graphrag, knowledge graphs, large language models, llm, rag, vector database

Графы знаний в RAG-системах - будущее интеллектуального поиска

Читать полностью »

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

2026-01-08 в 14:55, admin, рубрики: large language models, llm, оптимизация нейросетей

Эксперимент по хирургическому удалению слоёв из языковой модели

TL;DR

Я взял TinyLlama (1.1B параметров, 22 слоя) и начал удалять из неё слои, чтобы проверить гипотезу: современные LLM переобучены, и многие слои делают одно и то же.

Результаты:

Удалил 1 средний слой → +10% скорость, -4% качество
Удалил 7 слоёв (безопасных) → +30% скорость, -2.5% качество
Удалил первый слой → модель сломалась
Неожиданно: Layer 2 важнее Layer 0! (+6.67 vs +3.92 perplexity)

Протестировал все 22 слоя по отдельности. Вот что нашёл.

Зачем это нужно?

Читать полностью »

У меня нет рта, но я должен выводить эмодзи морского конька

2025-10-06 в 11:55, admin, рубрики: Claude Sonnet, gpt-5, large language models, большие языковые модели

Существует ли эмодзи морского конька? Давайте спросим об этом у GPT-5 Instant:

Читать полностью »

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

2025-09-12 в 13:10, admin, рубрики: large language models, llm, rag, векторные базы данных, Векторные хранилища, индексация, ранжирование, эмбеддинги

Автор статьи: Сергей Слепухин

В первой части мы кратко рассмотрели предпосылки и последствия ИИ‑трансформации деятельности юристов, а также предложили вариант архитектуры продвинутой RAG‑системы, учитывающей особенности юридической предметной области.

Во этой частиЧитать полностью »

Law & Practice Ensemble RAG. Как создать ассистента, помогающего решать многоаспектные юридические задачи

2025-09-11 в 14:15, admin, рубрики: dense retrieval, Fine-tuning, large language models, llm, rag, трансформеры, эмбеддинги, языковые модели

Автор статьи: Сергей Слепухин

Большие языковые модели (LLM) в последние несколько лет являются ключевым направлением искусственного интеллекта (ИИ). Дальнейшее развитие LLM, очевидно, меняет сам способ взаимодействия с технологиями, снижая порог входа для представителей всех профессий, в том числе исконно гуманитарных.

Читать полностью »

Карьера вайб-кодера — это тупик

2025-07-31 в 7:33, admin, рубрики: large language models, llm-агент, vibecoding, большие языковые модели, вайб-кодинг

Сразу расставлю все точки над «и»: LLM полезны. Вопрос не в том, могут ли LLM писать код, они на это способны. Вопрос в том, почему вайб-кодинг может оказаться вашей худшей карьерной инвестицией.

Читать полностью »

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения

2025-07-24 в 21:44, admin, рубрики: AI, alignment, deep learning, jailbreak, large language models, machine learning, multi-agent systems, prompt engineering, rag, reinforcement learning

Аналитический центр red_mad_robot разобрал объёмную научную статью «Advances and Challenges in Foundation Agents» от группы исследователей из передовых международных университетов и технологических компаний. Работа предлагает новый взгляд на текущее состояние и развитие «интеллектуальных агентов», которые могут адаптироваться к множеству задач и контекстов. Рассказываем, какие идеи лежат в основе Foundation Agents, с какими проблемами предстоит столкнуться, и что ждёт нас в будущем.

Читать полностью »

Как я нашёл уязвимость в ядре Linux при помощи модели o3

2025-05-27 в 14:15, admin, рубрики: large language models, llm, o3, openai o3, use-after-free, большие языковые модели, уязвимости

В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная настройка, агентские фреймворки и инструменты.

Читать полностью »

Prompt-инженерия: уменьшение сложности промпта

2025-05-27 в 7:13, admin, рубрики: large language models, промпт-инжиниринг, промпты, языковые модели

Часто, сталкиваясь с нестабильностью LLM, компании ошибочно пытаются «задавить» проблему, переходя на более дорогие модели. Это распространённое, но крайне неэффективное решение. Даже самая продвинутая LLM будет давать непредсказуемый результат, если ей «скормить» сложный промпт.

Я хочу поделиться фреймворком того, как смотреть на промпт, чтобы добиваться стабильности и качества без лишних затрат.

Что же такое промпт? Кратко

Промпт — это набор идей. Эти идеи несут в себе информацию о:

том, что есть;
том, что с этим делать.

Читать полностью »

250 откликов за 20 минут: как я автоматизировал процесс ответов на вакансии

2025-01-08 в 13:24, admin, рубрики: chatgpt, large language models, ruvds_перевод, автоматизация, вакансии, поиск работы, порталы по поиску работы, резюме, собеседования

Будем откровенны: поиск работы — это отстой.

Это мучительный цикл многократного копипастинга одной и той же информации, внесения сотен мелких правок в резюме и написания сопроводительных писем, которые должны выглядеть, как мольба, но не слишком очевидная.

Обратим внимание на следующее: повторяющиеся задачи + структурированный процесс = идеальный кандидат для автоматизации.

Поэтому я поступил так, как поступил бы любой разработчик в здравом уме — создал систему автоматизации всей этой фигни. В конечном итоге я смог разослать 250 откликов на вакансии за 20 минут. (Ирония заключается в том, что я получил оффер ещё до того, как закончил создавать эту систему. Подробнее об этом ниже.)

В статье я расскажу, как я это сделал.Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «large language models»

Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

TL;DR

Зачем это нужно?

У меня нет рта, но я должен выводить эмодзи морского конька

Law & Practice Ensemble RAG. Как создать ИИ-ассистента, помогающего решать многоаспектные юридические задачи

Law & Practice Ensemble RAG. Как создать ассистента, помогающего решать многоаспектные юридические задачи

Карьера вайб-кодера — это тупик

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения

Как я нашёл уязвимость в ядре Linux при помощи модели o3

Prompt-инженерия: уменьшение сложности промпта

Что же такое промпт? Кратко

250 откликов за 20 минут: как я автоматизировал процесс ответов на вакансии