Триллион параметров, 63 млрд активных: модель Ling-2.5-1T бросает вызов DeepSeek V3.2
Ant Group, оператор платежной платформы Alipay и аффилиат Alibaba, выпустила Ling-2.5-1T — открытую языковую модель с триллионом параметров, из которых 63 млрд активны при генерации.
Модель обучена на 29 трлн токенов (против 20 трлн у предшественника), поддерживает контекстное окно до 1 млн токенов и распространяется под лицензией MIT.
habr.com