Релиз GLM-5: от вайб-кодинга к агентной инженерии
Z.ai представили GLM-5 — новую open-source модель для системной разработки и long-horizon агентных задач.По сравнению с GLM-4.7 масштаб вырос с 355B (32B active) до 744B параметров (40B active).
Объём предобучения увеличен с 23T до 28.5T токенов. Добавили DeepSeek Sparse Attention — это снижает стоимость инференса при сохранении длинного контекста.Для посттрейна команда сделала собственную асинхронную RL-инфраструктуру slime.
habr.com