Gemini 3 научили вглядываться в изображения как человек
Google представил Agentic Vision — новую возможность модели Gemini 3 Flash, которая превращает анализ изображений из одномоментного "взгляда" в пошаговое исследование.
Если раньше модель могла пропустить мелкую деталь вроде серийного номера или отдаленного дорожного знака и была вынуждена угадывать, то теперь она способна сама решить, куда приблизиться и что рассмотреть внимательнее.Технически это работает через цикл "думай — действуй — наблюдай".
habr.com