GPT-5.1 Thinking заняла первое место в одном из самых сложных бенчмарков для ИИ
GPT-5.1 Thinking пришла первой в бенчмарках ARC-AGI-1 и ARC-AGI-2, которые считаются одними из самых сложных и важных для ИИ.
Суть этих бенчмарков в том, что они пытаются замерить не знания модели, а ее способность к абстрактному мышлению в духе человека и способности решать задачи, которые он никогда не видел.На старте каждой задачи ИИ показывают два набора цветных табличек из клеток в состоянии "было" > "стало" — из них модель должна вывести правило, а затем применить его на новой задаче.
habr.com