GLM-5.1: Z.ai представила открытую модель для длинных агентных задач и сложной разработки кода

habr.com:

Z.ai представила GLM-5.1 — новое флагманское поколение своей модели для агентной разработки. По заявлению компании, модель заметно прибавила именно в задачах программирования по сравнению с предыдущей версией.Судя по опубликованным результатам, GLM-5.1 показывает лучший на текущий момент результат на SWE-Bench Pro, а также с большим отрывом опережает GLM-5 на NL2Repo, где оценивается генерация репозиториев, и на Terminal-Bench 2.0, который проверяет работу модели в реальных терминальных сценариях.Разработчики делают акцент не только на качестве первого ответа, но и на работе модели вдолгую.

По их словам, многие предыдущие модели, включая GLM-5, быстро упираются в потолок: сначала дают быстрый прирост, а затем почти перестают улучшать результат, даже если дать им больше времени.GLM-5.1, как утверждает Z.ai, лучше приспособлена к длинным агентным сценариям.

Читать на habr.com Все новости от habr.com

«Сбер» представил модель для редактирования и создания изображений Kandinsky 6.0 Image

OpenAI снова убила Codex – GPT-5.5 навсегда поглотила отдельную модель для кодинга

xAI выпустила флагманскую голосовую модель для реального общения

DeepSeek выпустил V4 — открытую модель с контекстом в миллион токенов

«Сбер» представил модель для редактирования и создания изображений Kandinsky 6.0 Image

OpenAI снова убила Codex – GPT-5.5 навсегда поглотила отдельную модель для кодинга

xAI выпустила флагманскую голосовую модель для реального общения

DeepSeek выпустил V4 — открытую модель с контекстом в миллион токенов

Playmaji представила USB-устройство для оцифровки физических копий ретро-игр Polymega Remix

Kimi выпустили открытую модель K2.6 для долгих задач по программированию

OpenAI выпустила GPT-Rosalind: модель для создания лекарств обошла 95% экспертов в задаче по РНК