GPT-5-Pro стала новым лидером в сложнейшем ИИ-бенчмарке
ARC Prize сообщает, что GPT-5-Pro смогла показать результат в 18,3% в бенчмарке ARC-AGI-2, который считается одним из самых сложных для ИИ.
Предыдущим лидером был Grok 4 с результатом 15,9%, а вот до «человеческого» уровня модели далеко — это минимум 85%.Бенчмарк ARC-AGI-2 — это «Корпус абстракции и рассуждения (Abstraction and Reasoning Corpus)».
habr.com