cognitronn технологии экономика бюджет фантастика крипто cognitronn

Ai2 открыла кодинг-агентов SERA. Почему это важнее, чем кажется на первый взгляд

Институт Аллена по ИИ (Ai2) выложил в open-source семейство кодинг-агентов SERA. Речь идет о полноценном агентном стеке, заточенном под работу с реальными, грязными и большими кодовыми базами, а не синтетическими задачами из учебников.Флагманская версия SERA-32B показывает 55%+ на SWE-Bench Verified, обгоняя не только открытые модели вроде Qwen3-Coder, но и некоторые закрытые коммерческие решения.

Это особенно важно, потому что SWE-Bench проверяет не абстрактные навыки, а умение чинить баги в настоящих репозиториях, с зависимостями, тестами и контекстом.Младшая модель SERA-8B набирает 29,4%, и для своего размера это очень сильный результат.

DMCA