Вышла мультимодальная модель, разработанная для понимания интерфейсов
Представлена Holo2, мультимодальная модель нового поколения, разработанная для понимания интерфейсов, эффективной навигации и рассуждений в веб-пространстве, на десктопах и мобильных устройствах.
Модель демонстрирует существенное улучшение ключевых показателей на бенчмарках UI-grounding, достигая 66,1% на ScreenSpot-Pro и 76,1% на OSWorld-G, что выше предыдущих версий на 3–5% и превосходит все существующие аналоги.
habr.com