Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2
Команда Poetiq из Майами преодолела порог 50% точности на ARC-AGI-2 — тесте, на абстрактное мышление, который считается одним из самых сложных для современных ИИ.
Задачи в нем напоминают головоломки из тестов на IQ: нужно посмотреть на несколько примеров задач на визуальное мышление и их решенных вариантов, понять правило преобразования и применить его к новому примеру.
habr.com