TL;DR
54 дня назад у нас была идея — единый чат‑бот, через который можно работать с разными моделями ИИ. Сегодня в проде: бот в мессенджере MAX, 5903 пользователя, ~300 DAU, премиум‑подписка через ЮКассу с автоплатежами, 10+ моделей ИИ под одним интерфейсом, 6 модальностей ввода. Платежи запустили 5 мая 2026.
Команда: нас двое плюс AI‑ассистент в роли парного программиста. IT‑ бэкграунд есть, но в коммерческой разработке мы не работали. С n8n до этого знакомились на уровне «10 нод поковырять». Сейчас в проекте около 20 связанных воркфлоу, в одном только Main — 271 нода.
Это первая статья из цикла. Здесь общая картина: что придумали, зачем, из чего собрали, на чём работает. Без глубоких разборов — каждый блок раскроем в отдельной статье. Оглавление в конце.
Все цифры — срез на 8 мая 2026, 54-й день проекта. К моменту публикации они уже будут другими: продукт активный, аудитория растёт.
Спойлер: хотели один бот, получили три
Замышляли один — ИИ‑хаб с подпиской. По ходу появились ещё два:
-
Скачивалка видео из соцсетей. Изначально была лидмагнитом для основного бота. Отделилась в самостоятельный продукт со своей аудиторией.
-
Админ‑бот. Внутренний инструмент для нас самих: аналитика, управление пользователями, запуск рекламных кампаний прямо из мессенджера.
Каждый живёт на своём наборе воркфлоу. БД у основного бота и админ‑бота общая (админка пишет туда же, куда читает основной). У скачивалки — отдельная.
Это не было планом. Так получилось из архитектуры: когда модули достаточно изолированы, отдельные функции сами превращаются в самостоятельные продукты.
Что мы придумали и зачем
Идея. ИИ‑хаб в одном чате. Пишешь в мессенджер — получаешь доступ к 10+ моделям. Текст, картинки, видео, поиск, скачивание из соцсетей, анализ фото и документов, голосовые. Без переключения между сервисами, без отдельных подписок на каждый ИИ, без VPN.
Почему MAX. Платформа новая, активно развивается, конкуренция в нише ИИ‑ботов ещё низкая. На фоне перегретого Telegram это окно: те же продуктовые механики, но дешевле привлечение и меньше драки за внимание. В MAX можно занять нишу в момент её формирования; на зрелой площадке пришлось бы биться с десятками устоявшихся ботов.
Почему сейчас. Стек ИИ‑моделей в 2026 — зрелый, дешёвый, стабильный. Можно собирать продукт‑агрегатор без R&D на каждую модальность.
Что бот умеет
6 модальностей ввода: текст, голосовое, фото, документ (PDF), deep link, callback‑кнопка.
4 типа генерации: текст (10 моделей), картинки, видео (8-секундные ролики со звуком на Veo 3.1), апскейл картинок.
Дополнительно: веб‑поиск (RAG), скачивание видео из соцсетей (YouTube, TikTok, Instagram, X и др.), память диалога, реферальная программа в обоих пользовательских ботах.
Маркетинговая воронка: deep links с зашитым контекстом генерации, авто‑бонусы на первом контакте, аналитика по этапам.
Тарифы: 3 подписки premium (1, 3, 12 месяцев) + 11 пакетов отдельных генераций. Бесплатные лимиты — три уровня: демо, подписка на канал, рефералка.
Подробный разбор каждого блока — в отдельных статьях цикла.
Архитектура верхнего уровня
┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ Юзер: │ │ Юзер: │ │ Мы: │
│ ИИ-хаб │ │ скачивалка │ │ админ-бот │
└──────┬───────┘ └──────┬───────┘ └──────┬───────┘
│ событие │ событие │ событие
▼ из MAX ▼ из MAX ▼ из MAX
┌─────────────────────────────────────────────────────┐
│ Сервер n8n (оркестратор) │
│ - Main (271 н.) - downloader (43) - admin (67) │
│ - 7 воркеров через Execute Workflow │
│ - 5 cron-задач, 5 ручных операций │
└────┬────────────────────────────────────────────────┘
│
▼
┌──────────────┐ ┌──────────────┐ ┌──────────────────┐
│ Postgres VPS │ │ FastAPI VPS │ │ Сервер │
│ - таблицы │◄─┤ - 8 эндпоин- │ │ мониторинга │
│ - бэкапы 1/д │ │ тов ЮКассы │ │ - все остальные │
└──────────────┘ └──────┬───────┘ └──────────────────┘
▼
┌──────────┐
│ ЮКасса │
└──────────┘
+ Self-hosted MeTube + Cobalt + RapidAPI
+ Cloudflare + nginx перед всеми внешними адресами проекта
У каждого бота — свой воркфлоу с триггером на события из MAX: основной ИИ‑хаб, скачивалка и наш внутренний админ‑бот. Все они через Execute Workflow дёргают общий пул из 7 воркеров (текст, фото, видео, апскейл, downloader × 2, premium_router). Плюс отдельно крутятся 5 cron‑задач (от каждых 5 минут до раз в 6 часов) и несколько ручных рассылок.
По факту три бота
-
ИИ‑хаб. Основной пользовательский бот с подпиской и платежами.
-
Скачивалка видео из соцсетей. Изолированный пользовательский бот, 2000+ юзеров. Своя БД, свой воркфлоу. Бесплатный, но с той же трёхуровневой механикой, что и в основном: демо‑лимит на старте, расширенный недельный лимит по подписке на канал, бонусы за рефералку.
-
Админ‑бот. Внутренний, для нас самих. Отдельный воркфлоу, общая БД с основным ботом. Через него — аналитика, запуск рекламных кампаний, генерация деплинков с заранее установленным промптом. Параллельно есть админ‑панель на HTML/JS/CSS — самостоятельное web‑приложение для тех же задач, но в браузере.
Скрин от утра 9 мая, график - это приток новых пользователей. Графы и запросы постоянно меняем, ищем компромисс, поэтому в вебе цифры пока не всегда корректны Реферальная программа есть в обоих пользовательских ботах (ИИ‑хаб и скачивалка), но у каждого своя — свои правила начисления, свой пул бонусов, своя экономика. В админ‑боте рефералки нет — он не для пользователей.
Три канала в MAX вокруг этого
К каждому направлению — свой канал в MAX. Не для красоты, а как часть продуктовой инфраструктуры: подписка на канал расширяет недельный лимит, и через канал гонятся рекламные деплинки.
-
Канал ИИ‑хаба — появился 15 марта 2026, в день идеи. Сейчас 3778 подписчиков.
-
Канал скачивалки — появился 10 апреля 2026. Сейчас 1430 подписчиков.
-
Канал по ИИ‑промптам — появился тогда же, 10 апреля. Сейчас 1234 подписчика. Это полигон, на котором мы тестируем deep links с механикой
ad_prompt: юзер видит готовый результат в рекламном посте → жмёт кнопку → попадает в бота → прикрепляет своё фото → получает аналог. Подробнее — в Части 4 цикла.
Получается, главный канал живёт ровно столько же, сколько проект (54 дня), а два дополнительных — по 28 дней каждый.
Стек и технологии
4 VPS
-
Сервер n8n. Оркестрация всех бизнес‑процессов. Развёрнут в Docker с обязательным Redis — без него очереди и устойчивость n8n на нашем масштабе работают плохо. Изолированно, без посторонней нагрузки.
-
Сервер PostgreSQL. БД вынесена отдельно для устойчивости. Наружу не выставлена, доступ только через SSH‑туннель. Бэкапы ежедневные.
-
Сервер FastAPI. Только под платёжное API. Python, async, asyncpg, nginx, Let's Encrypt с автообновлением. Туннель к БД —
autosshс автозапуском в systemd. -
Сервер мониторинга. Наблюдает за состоянием всех остальных и одновременно служит управляющим контуром. На нём:
-
доступность и нагрузка серверов;
-
количество пользователей в реальном времени;
-
стадии воронки — на каком шаге сколько юзеров;
-
стата по рекламным кампаниям;
-
управление пользователями и их пакетами.
То есть это и dashboard, и панель оператора одновременно.
-
Дополнительные сервисы
-
Self‑hosted MeTube + Cobalt + RapidAPI — для скачивания медиа из соцсетей.
-
Все внешние адреса проекта закрыты Cloudflare + nginx. nginx терминирует TLS, балансирует, закрывает прямой доступ к контейнерам. Cloudflare сверху — кеширование, базовая защита, скрытые origin‑адреса. Это касается всего: публичных страниц (оферта, политика), платёжного API, MeTube/Cobalt, любых HTTP‑эндпоинтов.
-
Несколько собственных доменов под разные задачи. TLS на собственном домене — требование ЮКассы для одобрения recurring. Держать всё на одном домене было бы рискованно с точки зрения изоляции — поэтому платёжное API, публичные страницы и медиа‑сервисы живут на разных.
Платежи
-
ЮКасса с одобренным recurring. Это отдельная заявка с ручной модерацией, не «нажми кнопку».
-
54-ФЗ‑фискализация через «Чеки от ЮКассы».
-
Идемпотентность на нескольких уровнях — и БД, и приложение. Подробности в Части 3.
ИИ
-
Несколько API‑агрегаторов одновременно — разные провайдеры под разные задачи.
-
Свой пул платных прокси для обхода региональных ограничений и стабильности.
Модели
-
Текст: GPT-5, GPT-5-mini, Claude Sonnet 4.6, Claude 4.6 Thinking, Gemini 3 Pro, Gemini 3 Flash, DeepSeek v3.2, DeepSeek R1 Thinking, GPT-4o, GPT-4o‑mini.
-
Картинки: Nano Banana, Nano Banana 2, Nano Banana Pro, GPT Image 1.5.
-
Видео: Veo 3.1 от Google.
-
Голос: Whisper.
-
Видео из соцсетей: Cobalt + MeTube + RapidAPI.
База данных
Несколько таблиц под разные задачи: профили пользователей, кошельки и квоты, лог платежей, тарифная сетка, история диалогов (для памяти бота), реферальная программа, рекламные кампании, ачивки. Каждая отвечает за одно понятие и расширяется независимо.
Цифры
-
54 дня от идеи до боевых платежей в проде (52 дня от первой строки кода).
-
5903 пользователя основного бота, ~300 DAU.
-
3 канала в MAX: 3778 подписчиков (ИИ‑хаб, с 15 марта в день идеи) / 1430 (скачивалка, с 10 апреля) / 1234 (промпты‑полигон для деплинков, с 10 апреля). Скачивалка‑бот — 2000+ пользователей.
-
4 + изолированные службы.
-
20 воркфлоу в n8n: 3 точки входа в мессенджер (Main, скачивалка, админ‑бот), 7 воркеров на Execute Workflow, 5 cron‑задач, 5 ручных запусков. Несколько сотен нод суммарно.
-
271 нода в одном Main, 89 веток обработки кнопочных команд внутри него.
-
8 эндпоинтов платёжного API на ~660 строк FastAPI.
-
10+ моделей ИИ под единым интерфейсом.
-
6 модальностей ввода, 3 сценария бесплатных лимитов, 14 платных позиций в тарифной сетке.
-
3 уровня защиты от двойных списаний.
-
10–14 дней из 54 ушло на аналитику и SQL — четверть проекта.
-
Лимит масштабирования в текущей архитектуре — ~50 000 пользователей при 4000–7000 DAU.
-
2 человека + AI‑ассистент в роли парного программиста.
План цикла
Дальше — последовательные углублённые разборы. Каждая статья самостоятельная, читается отдельно, но порядок я выстроил так, чтобы получился логичный путь от платформы к продукту.
Часть 2. n8n как оркестратор: 3 точки входа, 7 воркеров и подводные камни
Почему n8n оказался правильным выбором при нашем стартовом уровне и горизонте роста. Как устроены три бота на уровне воркфлоу: кто принимает события из мессенджера, кто делает тяжёлую работу, как они связаны между собой. Чем заняты семь воркеров и пять фоновых задач, и почему такое разделение себя оправдало. Отдельный большой блок — реальные подводные камни n8n, на которые мы наступали в продакшене: каждый стоил нам бага. Закончим прогнозом: на каком этапе и какие куски будем переписывать в чистый код.
Часть 3. Платежи: ЮКасса с recurring, 54-ФЗ и идемпотентность
FastAPI‑биллинг от и до. Полный цикл платежа от тапа кнопки в боте до апгрейда юзера. Как устроены автоплатежи по сохранённой карте. Что такое 54-ФЗ и почему без фискального чека первый боевой платёж падает с малопонятной ошибкой. Три уровня защиты от двойных списаний — почему трёх, а не двух. Страховка на случай потерянных webhook‑ов от платёжного провайдера. И самое неочевидное — как получить одобрение recurring у ЮКассы: это не «нажми кнопку», это отдельный процесс с ручной модерацией, который ожидался на на несколько недель, а прошел за несколько суток.
Часть 4. Маркетинговая воронка через deep links
ad_rek и ad_prompt — две механики, которые превращают рекламный пост в законченную воронку. Юзер видит готовый результат в посте → жмёт кнопку → попадает в бот в нужном состоянии → прикрепляет фото → получает результат. Внутри: state‑машина при онбординге, авто‑начисление бонусов в кошелёк, прокидывание UTM в аналитику, интеграция с биллингом. Три сценария бесплатных лимитов как маркетинговый рычаг: демо, подписка на канал, рефералка.
Часть 5. RAG‑поиск в чат‑боте
Как мы устроили веб‑поиск. Это не «агентский tool‑use», это классический RAG: один запрос в сторонний поисковый агрегатор, готовые сниппеты, инструктивный промпт для LLM. Разберём механику от и до, обсудим, где это работает, где упирается в потолок и какие напрашиваются улучшения.
Часть 6. Документация в команде из двоих + AI‑ассистент
Bus factor как реальный риск, а не модное слово. Ежедневные журналы — изменений, тех.долга, планов. Handoff'ы для подключения новой AI‑сессии. Принципы: «технический долг лучше документировать, чем помнить», «UX‑тексты слово в слово», «никакого wholesale rewrite», «бэкап перед инвазивной операцией». Как это работает на практике и сколько часов экономит.
Часть 7 (возможно). Аналитика как четверть проекта
Почему 10–14 дней из 54 ушло на SQL и схему БД, а не на фичи. Как unit‑экономика влияет на тарифную сетку. Что мы уже видим в админке (аудитория, конверсия по этапам), и что пока не считаем (денежная атрибуция кампаний — следующий шаг).
Что мы уже точно вынесли
-
AI‑ассистент не пишет за тебя — он усиливает дисциплину. Точечные правки и документация дают рабочий продукт; wholesale rewrite даёт хаос.
-
Аналитика идёт параллельно с фичами, не «потом».
-
Платить за премиум у конкурентов — это product research, а не расход.
-
Выбор платформы — часть продуктовой стратегии. MAX дал нам окно.
-
Стек выбирается по горизонту планирования. n8n покрывает наш потолок ~50 000 пользователей при 4000–7000 DAU; раньше переходить в чистый код — преждевременная оптимизация.
-
Bus factor закладывается с первого дня. Команда из двоих + AI — это всегда риск; журналы и handoff'ы это страховка.
Что в ближайших планах
-
Контент‑завод для канала скачивалки. Автогенерация постов с ИИ‑роутингом по тематикам и форматам. Первая версия уже собрана, но пока не внедрена. После запуска должно сильно сократить ручной труд при ведении канала и поднять регулярность публикаций.
Если зашло — следующая часть про n8n‑оркестрацию выйдет следом. По ходу цикла буду собирать вопросы из комментариев и встраивать ответы в соответствующие статьи.
Автор: simonovv
