Первая часть тут. В обзор добавил Claude Sonnet 4, GPT o3 и 4.1, Qwen3, Llama 4 Maverick, Grok
Мир меняется динамично. Отдельную LLM Arena для 1С‑ного кода наверное делать смысла нет, но периодически информация обновляется.
Если для ЯП общего назначения информацию о наиболее крутых моделях найти не составляет труда, то для 1С мой «кустарный бенчмарк» кажется пока лучшее что можно обнаружить.
Принцип по которому выбрал всё тот же: LLM Arena + Статистика OpenRouter.
Эксперименты подробно описал в предыдущей статье, поэтому отдельно останавливаться не буду.