Baidu представила мультимодальную ERNIE, которая обходит GPT и Gemini в ключевых тестах
Baidu выпустила новую мультимодальную модель ERNIE-4.5-VL-28B-A3B-Thinking, и по ряду бенчмарков она уже показывает результаты выше GPT-5 и Gemini 2.5 Pro.
Главный акцент — на корпоративных данных, которые остаются недоступными для классических текстовых моделей: инженерные схемы, видео с производственных линий, медицинские изображения и другой «тяжёлый» контент.Архитектурно ERNIE примечательна тем, что остаётся «лёгкой»: в процессе работы активируется порядка трёх миллиардов параметров.
habr.com