Nvidia анонсировала агентные Nemotron 3: 4x ускорение, 500B параметров и 1 млн контекста
Nvidia опубликовала новую версию агентных моделей Nemotron. Линейка Nemotron 3 будет выпускаться в трёх вариантах:Nemotron 3 Nano — модель с 30 млрд параметров, ориентированная на узкоспециализированные и ускоренные задачи;Nemotron 3 Super — версия на 100 млрд параметров для мультиагентных сценариев с высокоточным рассуждением;Nemotron 3 Ultra — с мощным движком рассуждений и ~500 млрд параметров, рассчитанная на самые сложные задачи.При создании Nemotron 3 Nvidia, как она сама подчёркивает, опиралась на гибридную архитектуру микшера экспертов (MoE), чтобы повысить масштабируемость и эффективность.«Мы считаем, что находимся в уникальном положении, позволяющем обслуживать самый широкий круг разработчиков, которым нужна полная свобода в кастомизации моделей для создания специализированного ИИ, — за счёт сочетания нашей новой гибридной архитектуры mixture‑of‑experts с контекстным окном в один миллион токенов», — пояснила Карри Бриски, вице‑президент Nvidia в области GenAI‑софта.По данным Nvidia, среди первых пользователей Nemotron 3 — Accenture, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens и Zoom.В Nvidia подчёркивают, что дизайн «обеспечивает рост пропускной способности по токенам до 4-кратного» по сравнению с Nemotron 2 Nano, а также существенно уменьшает стоимость генерации за счёт сокращения генерации токенов рассуждения — вплоть до 60%.Кроме того, в версиях Super и Ultra задействована новая архитектура latent MoE.Модели Nemotron 3 также выиграли от расширенного обучения с подкреплением.
Более крупные версии — Super и Ultra — обучались с использованием 4-битного формата NVFP4, что позволяет тренировать их на существующей инфраструктуре без потери точности.Бенч
habr.com