Nvidia анонсировала агентные Nemotron 3: 4x ускорение, 500B параметров и 1 млн контекста

habr.com:

Nvidia опубликовала новую версию агентных моделей Nemotron. Линейка Nemotron 3 будет выпускаться в трёх вариантах:Nemotron 3 Nano — модель с 30 млрд параметров, ориентированная на узкоспециализированные и ускоренные задачи;Nemotron 3 Super — версия на 100 млрд параметров для мультиагентных сценариев с высокоточным рассуждением;Nemotron 3 Ultra — с мощным движком рассуждений и ~500 млрд параметров, рассчитанная на самые сложные задачи.При создании Nemotron 3 Nvidia, как она сама подчёркивает, опиралась на гибридную архитектуру микшера экспертов (MoE), чтобы повысить масштабируемость и эффективность.«Мы считаем, что находимся в уникальном положении, позволяющем обслуживать самый широкий круг разработчиков, которым нужна полная свобода в кастомизации моделей для создания специализированного ИИ, — за счёт сочетания нашей новой гибридной архитектуры mixture‑of‑experts с контекстным окном в один миллион токенов», — пояснила Карри Бриски, вице‑президент Nvidia в области GenAI‑софта.По данным Nvidia, среди первых пользователей Nemotron 3 — Accenture, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens и Zoom.В Nvidia подчёркивают, что дизайн «обеспечивает рост пропускной способности по токенам до 4-кратного» по сравнению с Nemotron 2 Nano, а также существенно уменьшает стоимость генерации за счёт сокращения генерации токенов рассуждения — вплоть до 60%.Кроме того, в версиях Super и Ultra задействована новая архитектура latent MoE.Модели Nemotron 3 также выиграли от расширенного обучения с подкреплением.

Более крупные версии — Super и Ultra — обучались с использованием 4-битного формата NVFP4, что позволяет тренировать их на существующей инфраструктуре без потери точности.Бенч

Читать на habr.com Все новости от habr.com

Alibaba анонсировала Qwen3-TTS-VD-Flash и Qwen3-TTS-VC-Flash: модели для синтеза и клонирования голоса

В Китае анонсировали ИИ-ускоритель, который превзойдет Nvidia H100

Xiaomi выпустила MiMo-V2-Flash 309B, модель достигла абсолютного верха в агентном бенчмарке

NVIDIA может сократить поставки видеокарт GeForce RTX 50 в первой половине 2026 года — первыми ограничения затронут модели 5070 Ti и 5060 Ti

Alibaba анонсировала Qwen3-TTS-VD-Flash и Qwen3-TTS-VC-Flash: модели для синтеза и клонирования голоса

В Китае анонсировали ИИ-ускоритель, который превзойдет Nvidia H100

Xiaomi выпустила MiMo-V2-Flash 309B, модель достигла абсолютного верха в агентном бенчмарке

Два двойных башенных кулера CPU на NVIDIA RTX 2060 снизили температуру на 35°C — новый мод TrashBench

FT назвала главу Nvidia человеком года

NVIDIA предложила ИИ-концепцию для инженерного моделирования

Nvidia будет программно отслеживать местоположение ИИ-ускорителей для борьбы с контрабандой