- PVSM.RU - https://www.pvsm.ru -

Третьего дня я решил сделать лид-магнит для своего Telegram-канала. Схема такая - бот собирает у пользователя текст, обрабатывает его нейросетью, выдает что-то полезное, и в конце просит подписаться на канал в обмен на результат. Aiogram 3, Python, за 150 рублей - ничего необычного.
Встал первый вопрос - за что платить? Бот прототипный, аудитория на входе пока еще, собственно, не особо и понятно сколько человек. Платить $20 в месяц ради теста гипотезы - нет. Мы не ищем легких путей. Пошел разбираться, что вообще бесплатного есть.
console.groq.com [2]
Groq работает на собственных чипах LPU, инференс - Llama 3.1 8B выдает около 2 000 токенов в секунду. API OpenAI-совместимый.
Есть вполне реальные лимиты бесплатного плана:
|
Модель |
Запросов/мин |
Запросов/день |
Токенов/мин |
Токенов/день |
|
llama-3.1-8b-instant |
30 |
14 400 |
6 000 |
500 000 |
|
llama-3.3-70b-versatile |
30 |
1 000 |
12 000 |
100 000 |
|
openai/gpt-oss-120b |
30 |
1 000 |
8 000 |
200 000 |
|
openai/gpt-oss-20b |
30 |
1 000 |
8 000 |
200 000 |
|
qwen/qwen3-32b |
60 |
1 000 |
6 000 |
500 000 |
|
llama-4-scout-17b |
30 |
1 000 |
30 000 |
500 000 |
|
groq/compound |
30 |
250 |
70 000 |
без лимита |
|
groq/compound-mini |
30 |
250 |
70 000 |
без лимита |
14 400 запросов в день от Llama 3.1 8B - это 10 запросов в минуту на протяжении 24 часов. Для прототипного бота с сотнями пользователей - более чем хватит.
|
Модель |
Запросов/мин |
Запросов/день |
Секунд аудио/день |
|
whisper-large-v3 |
20 |
2 000 |
28 800 |
|
whisper-large-v3-turbo |
20 |
2 000 |
28 800 |
Очень даже неплохо.
|
Модель |
Запросов/мин |
Запросов/день |
|
orpheus-v1-english |
10 |
100 |
|
orpheus-arabic-saudi |
10 |
100 |
100 запросов в день по TTS - немного. Для статусных сообщений или приветствий хватит, для основного контента - нет.
openrouter.ai [3] - регистрация, ключ, и сразу доступ к моделям.
20 запросов в минуту
50 запросов в день - без пополнения счета
1 000 запросов в день - после пополнения от $10 (деньги не тратятся на :free модели)
Актуальные бесплатные модели на май 2026, все по $0/1M токенов:
|
Модель |
Контекст |
|
qwen3-coder-480b-a35b |
1 050K |
|
kimi-k2.6 |
262K |
|
gemma-4-26b-a4b |
262K |
|
llama-3.3-70b-instruct |
131K |
|
minimax-m2.5 |
205K |
|
hermes-3-405b-instruct |
131K |
|
qwen3-next-80b-a3b-instruct |
262K |
|
lfm2.5-1.2b-thinking |
33K |
Есть еща такая штука openrouter/free. Он сам выбирает из доступных бесплатных ту, что поддерживает параметры запроса.
aistudio.google.com/apikey [4]
Актуальные модели на май 2026 с бесплатным доступом:
gemini-2.5-flash
gemini-2.5-flash-lite
gemini-2.5-pro
gemini-3.1-flash-lite
gemini-3.5-flash
Важный момент: на бесплатном тире промпты и ответы используются для обучения Google. Если бот обрабатывает данные, которые пользователь не собирался никуда передавать - это нужно учитывать. На платном тире обучение отключается.
developers.cloudflare.com/workers-ai [5]
Бесплатно: 10 000 Neurons в день (сбрасывается в 00:00 UTC).
Выше квоты: $0.011 за 1 000 Neurons - нужен Workers Paid план ($5/мес).
100+ моделей: Llama, Mistral, Qwen, Phi, Stable Diffusion и другие.
elevenlabs.io [6]
|
Plan |
Credits/мес |
~Минут TTS |
|
Free |
10 000 |
~10 мин |
|
Starter |
30 000 |
~30 мин |
10 000 кредитов в месяц - это примерно 10 минут синтезированной речи. Для приветствий или разовых сообщений в боте - хватит. Важно: Free план не дает коммерческой лицензии, только личное использование.
deepl.com/en/checkout?is_api=true [7] - ключ после регистрации.
|
Параметр |
Значение |
|
Символов/месяц |
500 000 |
|
Изображения (beta) |
Не тарифицируются |
|
Word/Excel/PDF/PPT |
до 10 MB и 500K символов |
500K символов в месяц - это примерно 350 страниц A4.
|
Параметр |
Значение |
|
Запросов/день |
500 (по IP) |
|
Engine 1/2 в месяц |
25 000 конвертаций |
|
Engine 3 в месяц |
2 500 конвертаций |
Engine 3 - рукописный текст, таблицы в Markdown, 200+ языков.
По итогу, основная модель у меня - llama-3.3-70b-versatile. 1 000 запросов в день для теста гипотезы очень даже хватает - пока при моем мелком потоке пользователей до потолка еще не добрался.
Если лимиты начнут упираться (очень на это надеюсь) - буду переходить на что-то уже более масштабируемое.
Надеюсь, Вам было полезно. Здоровья и хорошего настроения, дорогие читатели.
Автор: ArthurEx
Источник [9]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/groq/452423
Ссылки в тексте:
[1] VPS: https://www.reg.ru/?rlink=reflink-717
[2] console.groq.com: http://console.groq.com
[3] openrouter.ai: http://openrouter.ai
[4] aistudio.google.com/apikey: https://aistudio.google.com/apikey
[5] developers.cloudflare.com/workers-ai: https://developers.cloudflare.com/workers-ai/platform/pricing/
[6] elevenlabs.io: http://elevenlabs.io
[7] deepl.com/en/checkout?is_api=true: https://www.deepl.com/en/checkout?is_api=true
[8] ocr.space/ocrapi/freekey: https://ocr.space/ocrapi/freekey
[9] Источник: https://habr.com/ru/articles/1041398/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1041398
Нажмите здесь для печати.