mefdayy технологии люди экономика самит google Дом и интерьер gemini mefdayy

Gemini 2.5 от Google теперь поддерживает «разговорную сегментацию изображений»

Компания Google представила новую функцию для ИИ-модели Gemini 2.5. Теперь пользователи могут анализировать и выделять объекты на изображениях с помощью запросов на естественном языке.Эта «разговорная сегментация изображений» выходит за рамки традиционной сегментации изображений, которая обычно предполагает идентификацию объектов с использованием фиксированных категорий, таких как «собака», «машина» или «стул».

Теперь Gemini может понимать более сложные формулировки и применять их к конкретным частям изображения.Модель обрабатывает реляционные запросы, такие как «человек с зонтом», логические инструкции, например «все люди, которые не сидят», и даже абстрактные понятия, такие как «беспорядок» или «повреждение», которые не имеют четких визуальных границ.Gemini также может распознавать элементы изображения, для идентификации которых требуется чтение текста на экране, например «фисташковая пахлава» в витрине, благодаря встроенному распознаванию текста.

DMCA