runawayllm технологии люди общество самит runawayllm

GPT-5-Pro стала новым лидером в сложнейшем ИИ-бенчмарке

ARC Prize сообщает, что GPT-5-Pro смогла показать результат в 18,3% в бенчмарке ARC-AGI-2, который считается одним из самых сложных для ИИ.

Предыдущим лидером был Grok 4 с результатом 15,9%, а вот до «человеческого» уровня модели далеко — это минимум 85%.Бенчмарк ARC-AGI-2 — это «Корпус абстракции и рассуждения (Abstraction and Reasoning Corpus)».

DMCA