runawayllm люди экономика самит стартап google gemini runawayllm

Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2

Команда Poetiq из Майами преодолела порог 50% точности на ARC-AGI-2 — тесте, на абстрактное мышление, который считается одним из самых сложных для современных ИИ.

Задачи в нем напоминают головоломки из тестов на IQ: нужно посмотреть на несколько примеров задач на визуальное мышление и их решенных вариантов, понять правило преобразования и применить его к новому примеру.

DMCA