Xiaomi выпустила MiMo-V2-Flash 309B, модель достигла абсолютного верха в агентном бенчмарке
Китайский гигант Xiaomi представил MiMo‑V2-Flash — большую языковую модель с открытыми весами, которая претендует на лидерские позиции в конкретных дисциплинах. Технические характеристики: Архитектура: 309 млрд параметров (активных во время генерации отдельного токена — 15 млрд).Лицензия: MIT (открытая).Интеллект: набирает 66 баллов по комплексному Artificial Analysis Intelligence.Куда интереснее посмотреть, где модель блещет, а где спотыкается.Если проект завязан на агентских сценариях, где ИИ должен умело пользоваться инструментами, или на сложной математике, то MiMo‑V2-Flash точно заслуживает внимания.В тесте τ²‑Bench Telecom, оценивающем агентское использование инструментов, модель показала 95%, возглавив соответствующий рейтинг среди всех оценённых моделей.В соревновательной математике (AIME 2025) результат тоже на высоте — 96%.В погоне за детальными рассуждениями MiMo‑V2-Flash оказалась чемпионом по потреблению токенов: на прохождение тестового набора задач она израсходовала около 150 млн рассуждающих токенов.По AA‑Omniscience модель получила −42 балла, и основной вклад в этот негативный результат внёс относительно высокий уровень галлюцинаций.
Это критически важный момент для задач, где требуется максимальная фактологическая точность. Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас! Источник
habr.com