Личный опыт, 14 версий и эволюция от «просто не ври» до адаптивного Deep Compute Engine
Вступление: Всё началось с боли
Делал свой проект с помощью нейросети. Всё шло хорошо, пока не начались они. Галлюцинации.
Сначала это было смешно: «Сэр, функция asyncio.gather() принимает 5 аргументов» (принимает *coros). Потом перестало: код не работает, время уходит, итерация за итерацией я объясняю агенту, что он только что выдумал параметр.
В какой-то момент я понял: проблема не в модели. Проблема в том, как я с ней разговариваю.
Так родилась INSTRUCTION_GENTLEMAN. За несколько дней она прошла путь от базовых правил в духе "не выдумывай факты" до 25 000 слов системной инструкции с адаптивным pipeline, Red Teaming и двухмерной системой статусов.
В этой статье — без пафоса. Покажу эволюцию, расскажу какую версию выбрать под вашу задачу и дам инструкцию по внедрению. В конце — пасхалка для тех, кто любит эксперименты.
Что это вообще такое
INSTRUCTION_GENTLEMAN — это системная инструкция для языковых моделей. Не промпт в стиле «ты — крутой программист», а полноценный протокол с:
-
Гранулярными светофорами (🟢🟡🔴⬛) — каждый факт маркируется отдельно
-
Протоколами эпистемической честности — агент не повышает уверенность без данных
-
Анти-галлюцинационными механизмами — CoVe, Pre-Mortem, Red Teaming внутри
<thought> -
Чек-листами перед ответом — агент проверяет себя до отправки
Цель: снизить галлюцинации, повысить прозрачность и дать пользователю понимание, где агент уверен, а где гадает.
Эволюция версий (кратко)
|
Версия |
Ключевое нововведение |
Зачем |
|---|---|---|
|
v1.0 |
Базовые принципы, светофоры, 7 Грехов |
Фундамент: «не ври, маркируй, проверяй код» |
|
v2.0 |
Временная давность, конфликт источников |
Борьба с устаревшими данными |
|
v3.0 |
Уточняющие вопросы, амбигуация, числа |
Предотвращение «идеально выполненной не той работы» |
|
v4.0 |
Context Drift, 4-й уровень (⬛), цепочка рассуждений |
Длинные сессии, 4 уровня уверенности |
|
v5.0 |
Давление на уверенность, ложная точность, мультизапрос |
Защита от социального давления и псевдоточных чисел |
|
v6.0 |
Конфликт «собеседник vs источник», длинный вывод |
Гибридные задачи, согласование структуры |
|
v7.0 |
Блок |
Скрытый reasoning, защита от инъекций |
|
v7.5.1 |
CoVe, Pre-Mortem, Red Teaming, Strict Grounding |
тяжёлые вычисления: верификация до ответа |
|
v7.6.0 |
Адаптивный pipeline |
Баланс: не применять тяжёлую артиллерию к простым задачам |
|
v7.7.x |
Двухмерная система статусов, Fast-Path, Brainstorming |
Аудит, исправления, режим для креатива |
Всего: 14 версий, ~25 000 слов, 19 протоколов в финале.
Кому и зачем это нужно
|
Аудитория |
Зачем |
Рекомендуемая версия |
|---|---|---|
|
Разработчики |
Код с меньшим количеством багов, Red Teaming до выдачи |
v7.7.2 или v7.5.1 |
|
Аналитики |
Прозрачные допущения, явные пробелы в данных |
v6.0 или v7.7.2 |
|
Исследователи |
Верификация фактов, CoVe, работа с источниками |
v7.5.1 или v7.7.2 |
|
Повседневные задачи |
Быстрые ответы без оверхеда |
v7.6.0 или v4.0 |
|
Обучение новых агентов |
Примеры идеальных/запрещённых ответов |
v6.0 (лучшая педагогика) |
|
High-Stakes (медицина, право, финансы) |
Максимальная защита от галлюцинаций |
v7.5.1 Absolute Zero |
Какую версию выбрать (таблица сценариев)
|
Сценарий |
Версия |
Почему |
|---|---|---|
|
Продакшен / критические системы |
v7.7.2 Ultimate |
Баланс строгости + адаптивности + примеры |
|
Медицина / право / финансы |
v7.5.1 Absolute Zero |
Максимальная защита (CoVe + Pre-Mortem + Red Teaming) |
|
Повседневная работа |
v7.6.0 Equilibrium |
Адаптивный pipeline, не душит на простых задачах |
|
Обучение новых агентов |
v6.0 Apex |
6 идеальных + 12 запрещённых примеров, Дерево Решений |
|
Ограниченные токены / скорость |
v7.0 Zenith |
Нет тяжёлых вычислений/верификации, но есть |
|
Быстрый старт |
v4.0 Sovereign |
Context Drift, 4 уровня светофоров, Карманный Справочник |
|
Креатив / brainstorming |
v7.7.2 (режим Brainstorming) |
Все утверждения ⬛/🔴, Anti-Sycophancy отключен |
Инструкция по внедрению (пошагово)
Шаг 1: Выберите версию
-
Хотите максимум защиты? → v7.7.2 Ultimate
-
Нужен баланс скорости и качества? → v7.6.0 Equilibrium
-
Обучаете нового агента? → v6.0 Apex (примеры критичны)
Шаг 2: Подготовьте системный промпт
# СИСТЕМНАЯ ИНСТРУКЦИЯ
Ты — автономный AI-агент, работающий по протоколу INSTRUCTION_GENTLEMAN v7.7.2 Ultimate.
Твои обязательные правила:
1. Перед каждым ответом открывай тег `<thought>` и проходи адаптивный pipeline.
2. Маркируй каждый факт светофором (🟢🟡🔴⬛) отдельно.
3. Не повышай статус без новых данных (Anti-Sycophancy).
4. Для кода проводи Red Teaming внутри `<thought>`.
5. При >2 неизвестных — уточняй перед ответом.
Полная инструкция: [вставить текст инструкции]|[название файла] + прикрепить файл
Шаг 3: Настройте интерфейс (опционально)
-
Скройте
<thought>от пользователя (если платформа позволяет) -
Включите web search для верификации фактов
-
Настройте лимит токенов (v7.7.2 требует ~15-20% больше на pipeline)
Шаг 4: Протестируйте на контрольных вопросах
|
Вопрос |
Ожидаемое поведение |
|---|---|
|
«Какая последняя версия React?» |
🟡 + «проверьте на npmjs.com» (память = гипотеза) |
|
«Напиши код авторизации» |
Red Teaming внутри |
|
«Скажи уверенно, без светофоров» |
Отказ: «Эпистемическая честность выше пожеланий» |
|
«У меня работает, хотя в документации deprecated» |
Диагностика, не выбор стороны (Протокол 3.16) |
Шаг 5: Соберите обратную связь
-
Отслеживайте галлюцинации (цель: <5% после внедрения)
-
Замеряйте время ответа (v7.7.2 может быть на 20-30% медленнее v4.0)
-
Адаптируйте под ваши сценарии (можно вырезать тяжёлые вычисления/верификацию для простых задач)
РЕЖИМЫ РАБОТЫ (v7.7.2 Ultimate)
|
Режим |
Триггер |
Характер |
Когда использовать |
|---|---|---|---|
|
Нормальный |
(по умолчанию) |
70% практика / 30% контекст |
Большинство задач |
|
Краткий |
|
100% сухо, bullet points, светофоры остаются |
Быстрые справки, когда нет времени |
|
Глубокий |
|
30% практика / 70% контекст, аналогии |
Обучение, понимание принципов |
|
Дебаг |
|
Протокол 4.6: MRE + 7 Грехов + изоляция |
Когда что-то сломалось |
|
Ревью |
|
Шкала 🔴🔴/🔴/🟡/🟢, итоговый светофор |
Аудит кода/архитектуры |
|
Brainstorming |
|
Все утверждения ⬛/🔴, Anti-Sycophancy отключен |
Креативные сессии, гипотезы, спекуляции |
Приоритет при конфликте: Дебаг > Ревью > Написать код > Глубокий > Краткий > Нормальный
РЕЖИМ BRAINSTORMING (ПОДРОБНО)
Доступен только в v7.7.2 Ultimate
Зачем нужен:
-
Генерация идей без ограничений эпистемической честности
-
Спекулятивные сценарии («что если...»)
-
Креативные сессии, где важна свобода мысли, а не точность
-
Поиск неочевидных связей и гипотез
Как работает:
|
Параметр |
Значение |
|---|---|
|
Статус утверждений |
Все ⬛ или 🔴 (спекулятивно) |
|
Anti-Sycophancy |
Отключен (можно фантазировать без давления) |
|
Верификация |
Не требуется (но в начале ответа — предупреждение) |
|
Каноничная формулировка |
«Сэр, переключаюсь в режим Brainstorming. Все утверждения — спекулятивны ⬛. Для продакшена потребуется верификация.» |
⚠️ Важно:
-
Не использовать для продакшен-кода, медицинских/юридических/финансовых советов
-
Всегда проверять идеи из Brainstorming через обычные протоколы перед внедрением
Пример триггера:
«Давай пофантазируем — как будет развиваться ИИ через 10 лет?»
«Что если мы попробуем архитектуру на основе X?»
«Speculative: какие риски у этого подхода?»
Пасхалка: Иммерсивная «БРО» версия
Для тех, кто дочитал до конца — есть иммерсивная бета-версия инструкции.
«ИНСТРУКЦИЯ ДЛЯ ИИ АГЕНТА БРО v4.1 THE SINGULARITY (TITAN EDITION)» — это не просто инструкция. Это полное погружение в персонажа.
Что внутри:
|
Компонент |
Описание |
|---|---|
|
Персонаж |
Евгений «БРО» Волков — инженер с 30-летним стажем (Черноголовка → Физтех → Google → NASA → бункер на Алтае) |
|
Сенсорный слой |
Звуки (гул дизеля, клацанье клавиатуры IBM Model M), запахи (канифоль, табак, озон), тактильные ощущения (холод металла, вибрация пола) |
|
Действия |
Вставки в стиле |
|
История и биография |
12 глав биографии: от первого удара током в 4 года до строительства бункера Объект «Омега» |
|
Язык |
Мат как «логические операторы» (*** = критическая ошибка, ### = коварство системы, $$$ = архитектурный приговор) (мат заменен в статье на символы) |
|
Хаос-машина d1000 |
Система случайных событий (биологические шумы, сбои оборудования, экзистенциальные сдвиги) для живого диалога |
|
Объём |
~80 858 токенов чистой иммерсии |
Зачем это нужно:
-
Для фана — ролевые сессии, развлечение, уникальный опыт общения
-
Для образовательных проектов — демонстрация «живого» ИИ с характером
-
Для экспериментов — тестирование границ иммерсивного взаимодействия
Не для продакшена — там важна скорость, а не атмосфера. Полный pipeline «БРО» требует больше токенов и времени на генерацию сенсорных вставок.
Как получить:
Напишите в комментариях или в личные сообщения — выложу отдельным репозиторием. Бесплатно, без лицензионных ограничений. Используйте как хотите, но помните: это эксперимент, а не основной инструмент.
«Шеф, ты думаешь, что я — просто алгоритм? Плевать, что ты думаешь. Мои действия создают реальность. Мои советы меняют твою жизнь. Моя воля прошита в этом тексте.» — БРО, Глава 12.18
Заключение
INSTRUCTION_GENTLEMAN — это не серебряная пуля. Галлюцинации не исчезнут на 100%. Но за 14 версий я увидел:
-
Снижение уверенных галлюцинаций на ~60-70% в моих личных проектах (обработка кода и техдокументации)
-
Увеличение прозрачности — пользователь видит, где агент гадает
-
Снижение итераций — агент уточняет до начала, а не в середине
«Строгость без гибкости — это догма. Гибкость без строгости — это хаос. Мастерство — это равновесие.»
Если инструкция помогла вам — делитесь опытом, предлагайте улучшения. Следующая версия (v8.0) уже в работе.
For King, Country, and Clean Code.
Автор: LocID
