MiniMax представили M2.5 — флагманскую модель для кодинга и агентных задач
MiniMax выпустили MiniMax-M2.5. Модель обучали с RL в сотнях тысяч реальных окружений. Фокус — кодинг, tool use, поиск и офисные сценарии.По бенчмаркам:80.2% на SWE-Bench Verified51.3% на Multi-SWE-Bench76.3% на BrowseComp (с управлением контекстом)SWE-Bench Verified M2.5 проходит на 37% быстрее, чем M2.1: среднее время снизилось с 31.3 до 22.8 минут.
Это сопоставимо с Opus 4.6 (22.9 мин), при этом заявленная стоимость задачи — около 10% от него.В кодинге модель обучалась более чем на 10 языках (Go, C/C++, Rust, TS, Python, Java и др.) в 200k+ средах.
habr.com