runawayllm люди общество крипто Enterprise gemini runawayllm

Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

OpenAI представила GPT-5.2 — свою новую флагманскую модель, которая доступна в API и раскатывается в ChatGPT. А организация ARC Prize уже опубликовала результаты своих бенчмарков ARC-AGI-1 и ARC-AGI-2, которые считаются сложным тестом на абстрактное мышление и нередко называются "экзаменом на AGI".

Модель заняла первое место в обоих бенчмарках, но остановимся на результатах ARC-AGI-2 — эта версия была выпущена недавно и считается, что ее задачи еще не "попали" в обучающие дата-сеты для ИИ.Итак, GPT-5.2 Pro выполняет 54,2% задач против 54% у предыдущего рекордсмена.

DMCA