Главная

Рубрика «карпаты»

2025: год, когда LLM-ы по-настоящему изменились

2025-12-21 в 10:31, admin, рубрики: вайб-кодинг, карпаты

Это перевод оригинальной статьи Андрея Карпатого.

2025 оказался насыщенным годом для больших языковых моделей. Ниже — список лично для меня заметных и немного неожиданных «смен парадигм». Вещи, которые изменили ландшафт и концептуально запомнились.

1. Reinforcement Learning from Verifiable Rewards (RLVR)

В начале 2025 года стек производства LLM во всех лабораториях выглядел примерно так:

Претрейнинг (GPT-2/3, ~2020)
Supervised Finetuning (InstructGPT, ~2022)
RLHF — обучение с подкреплением на основе человеческой обратной связи (~2022)

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «карпаты»

2025: год, когда LLM-ы по-настоящему изменились

1. Reinforcement Learning from Verifiable Rewards (RLVR)