Доработанная GPT-5.2 обошла человека в «тесте на AGI»
Стартап Poetiq из шести выходцев Google DeepMind добился 75% на бенчмарке ARC-AGI-2 — тесте на "гибкий интеллект" от Франсуа Шолле и команды ARC Prize.
Средний человек на том же тесте набирает 60%. Результат получен на GPT-5.2 X-High при стоимости менее $8 за задачу, это примерно на 15 процентных пунктов выше предыдущего лидера — обычной GPT-5.2 X-High.
habr.com