Рубрика «gemini 2.5 pro»

В апреле мой агент смог перешагнуть золотой порог на MLE-bench в агентских соревнованиях Berkeley RDI, а когда я решил показать «тот самый код, который взял золото» — понял, что не уверен, существует ли он вообще.

Меня зовут Георгий, и в своей первой статье на площадке я решил разобраться, что же происходило на самом деле. Цифровой детектив: с чем я преодолел планку, где этот результат теперь (спойлер: нигде) и сколько смысла в этом «золоте». Это история о том, как я расследовал собственную «победу»

Про сами агентские соревнования уже хорошо написали коллеги из AI Talent Hub — пост Читать полностью »

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 2 - 1

Часть 2 — это гайд по выживанию в мире кривых текстов, а также грамматический апокалипсис, куда мы закинули ChatGPT‑o1, o3, две штуковины от «Яндекса» — «Нейроредактор» и YandexGPT-5-ProЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js