Рубрика «gemini»

На GitHub лежат сотни AI-скиллов. Скилл для code review, скилл для дебага, скилл для обработки PDF, скилл для анализа безопасности. Установил в Cursor или Claude Code — и твой AI-ассистент стал умнее. Звучит как npm install: поставил пакет, он работает.

Но скилл — не пакет. Это текстовый файл с инструкциями, который читает языковая модель. А модели читают по-разному.

Читать полностью »

Предыстория

День как день, ничего особенного. Как обычно, после работы сбежал в гараж (мастерскую), чтобы отвлечься от проблем, требований и бесконечных указаний о том, когда и чем я должен заниматься. Сбежал в свой мир моделек, станков, стружки и эпоксидной смолы — мир сотни начатых и незаконченных идей.

 Фото моей берлоги

Фото моей берлоги Читать полностью »

Я программист. Разобраться с VPN казалось делом на полчаса. Gemini занял несколько дней.

Пишу это потому что злился, не понимал что происходит, и перепробовал кучу вещей которые не работали. Может сэкономлю вам время.

Что я пробовал (и что не помогло)

Завёл отдельный Google-аккаунт — чистый, никакой России. Отключил геолокацию везде где нашёл. Вычистил русский из Chrome и macOS: автоперевод, системная локаль, всё. Только инкогнито. Запретил Chrome доступ к геолокации через системные настройки. Куки, кэш. Американские серверы, европейские, разные. Телефон, ноут, Firefox, Safari.

Gemini продолжал показывать заглушку.

Читать полностью »

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское образование — это ФГОС, технологические карты уроков, ОГЭ, чувашский язык — и ничего из этого ни один бенчмарк не покрывает.

Мы сделали EduBench-RU — первый бенчмарк для оценки LLM на задачах российского образования в школах. 50 промптов, 22 модели, двойная оценка. И нашли кое-что неожиданное.

Что внутри

Читать полностью »

Я не лингвист. Я разработчик, который неделю вместо работы ковырялся в тредах на Reddit, читал earnings call Duolingo и тестил ChatGPT Voice Mode на испанском. Зачем - сам до конца не понял, но раз уж потратил время, напишу.

50 миллионов DAU - это Q4 2025, официальные данные. Пятьдесят миллионов человек каждый день открывают зелёную сову. Я начал искать хоть кого-то, кто ЗАГОВОРИЛ на языке благодаря Duolingo. Карточки - да. Страйки - да. A2 по внутренней шкале - пожалуйста. Но чтобы сесть в кафе в Мадриде и связать три предложения - не нашёл.

Может, плохо искал. А может нет. В любом случае - все пишут, что ChatGPT заменит репетитора за $20, и я полез проверять.

Читать полностью »

На что кодинг-агенты тратят наши токены - 1

На прошлой неделе я попросил Claude устранить однострочный баг. Ему понадобилось 23 тысячи токенов. Потом тот же баг я попросил устранить Gemini. Он потратил 350 тысяч токенов. Да уж, на такое невозможно закрывать глаза.

Поэтому я написал Context LensЧитать полностью »

Модель находит баг в криптографии, а криптограф узнаёт от неё новую математику - 1

Эта статья — ответ на критику: «перестаньте рассказывать сказки, как AI помогает в науке, покажите примеры!». Действительно, без примеров, рассказы об успешном успехе AI выглядят как сектантский бред.

Читать полностью »

MCPHero - новая библиотека/проект для Python для использования MCP tools как native tools в ИИ библиотеках типа openai, которые не поддерживают MCP сами по себе.

# В openai нельзя вызвать completions с MCP сервераами
response = client.chat.completions.create(
    model="gpt-4o",
    messages=messages,
    tools=tools,  # tools - должны быть специальные dict'ы, не ссылки до MCP
    # mcp_tools=my_mcs_tools  # такого аргумента, к  сожалению, нет
    # mcp_servers=my_mcp_servers  # такого аргумента, к сожалению, тоже нет
    tool_choice="auto"
)
Когда нейросеть решит то, что не решил никто? - 1

В середине 2024 года GPT-4 спотыкался на школьных задачах, а к концу 2025-го модели щёлкали олимпиадные как орехи. Полтора года, и мы преодалели дистанцию от «найди икс» до «докажи теорему». Epoch AI решили заглянуть еще дальшеЧитать полностью »

maneto solver

maneto solver

Мечта об идеальном двигателе

Мне кажется, я знаю, как должен быть устроен идеальный электродвигатель. Но чтобы это доказать, нужен инструмент.
Существующий софт убивал все желание творить:


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js