Новая Gemini 3 Deep Think обогнала среднего человека в «тесте на AGI»»
Google DeepMind выпустила крупное обновление Gemini 3 Deep Think — режима глубоких рассуждений, заточенного под научные и инженерные задачи.
Главная цифра: 84,6% на бенчмарке ARC-AGI-2, который тестирует способность учиться решать абстрактные задачи, не встречавшиеся в обучающей выборке.
habr.com