Модель ИИ Qwen2.5-VL от Alibaba может запускать Booking.com на Android и бронировать билеты из Чунцина в Пекин (видео)
Команда Qwen китайской компании Alibaba объявила о выпуске новой линейки AI моделей Qwen2.5-VL, способных выполнять ряд задач по анализу текста и изображений.Модели могут обрабатывать файлы, понимать видео, подсчитывать объекты на изображениях, а также управлять ПК, что подобно модели, которая работает в OpenAI Operator.По данным тестирования, модель Qwen2.5-VL превосходит GPT-4 от OpenAI, Claude 3.5 от Anthropic и Gemini 2.0 Flash от Google по результатам оценки понимания видео, математики, анализа документов и ответов на вопросы.
Модель способна анализировать графики и диаграммы, извлекать данные из сканов счетов и форм, а также "понимать" видео продолжительностью несколько часов.Интересной особенностью Qwen2.5-VL является способность взаимодействовать с программным обеспечением на ПК и мобильных устройствах.
gagadget.com