Рубрика «OpenAI»

Если вы работаете с LLM-провайдерами, то наверняка сталкивались с одной и той же проблемой: у OpenAI лимит 100 RPM на ключ, у Vertex AI — свои квоты на проект, у Anthropic — отдельные ограничения. В итоге приходится держать несколько ключей, балансировать нагрузку вручную, следить, чтобы один заблокированный доступ не уронил всё приложение, и при этом хочется сохранить единый OpenAI-совсместимый эндпоинт для клиентского кода.

Именно для этого и создан Auto AI RouterЧитать полностью »

Сегодня Anthropic закрыла использование своих подписок в сторонних инструментах вроде OpenClaw — они больше не покрываются подпиской. А использование по API обходится во много раз дороже. Весь вечер разбирался и обошёл блокировку. Всё работает как раньше.

Расскажу как, потому что процесс для меня оказался интереснее результата. Забавно, что я не пишу код, и помогал мне в обходе их блокировкок Opus 4.6.

Отправная точка

Читать полностью »

OpenClaw: установка и первые впечатления - 1

Каждый раз, когда вы вставляете рабочий код в чат с ИИ, в голове мелькает вопрос: «Не попадут ли мои данные не в те руки?» Единственный способ сохранить свои нервы — развернуть модель на собственном железе. А на фоне новости о переходе создателя OpenClaw в OpenAI сделать это хочется еще быстрее.

Читать полностью »

Текст написан автором и отредактирован с помощью ИИ

TL;DR: Платные модели embedding плохо работают с малоресурсными языками. OpenAI text-embedding-3-large набирает R@1 = 0,21 на армянском -- уровень случайного угадывания. Причина -- токенизатор: cl100k_base не содержит армянских токенов и разбивает текст побайтово, раздувая его в 10 раз по сравнению с английским. Бесплатные мультиязычные модели с SentencePiece/WordPiece-токенизаторами не имеют этой проблемы. Протестировано 19 моделей на 245 триплетах EN/RU/HY из TMDB. Лучший retrieval -- LaBSE (R@1 = 0,83), лучший alignment -- multilingual-e5-large (0,86).


Читать полностью »

OpenAI 5 месяцев строили продукт без единой строчки ручного кода. Миллион строк, 1500 PR, 7 инженеров. Я разобрал их подход и понял - я уже так работаю. И вы тоже можете.

Недавно OpenAI выложили статью Harness Engineering о том, как их команда построила и запустила внутренний продукт с нуля, где каждая строчка кода написана агентом (Codex на GPT-5). Не часть кода, не 80% - вообще все. Тесты, CI, документация, внутренние тулы, даже скрипты для управления самим репозиторием.

Читать полностью »

Пока генераторы текста на базе языковых моделей соревнуются в скорости производства поверхностных текстов на тему отъема рабочих мест, мне тоже есть, что сказать про гонку вооружений человека искусственными помощниками (которых здесь и далее я для простоты буду называть малорелевантным, но устоявшимся термином «ИИ»).

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js