NVIDIA представила Nemotron 3 Ultra: открытая 550B-модель, до 5 раз быстрее в своем классе
На кейноуте в Тайбэе 1 июня Дженсен Хуанг представил Nemotron 3 Ultra — старшую модель в открытом семействе Nemotron 3. Это рассуждающая модель примерно на 550 млрд параметров (почти как прошлогодний DeepSeek R1), которую NVIDIA позиционирует как открытую альтернативу закрытым флагманам для построения ИИ-агентов.
Сами веса обещают выложить 4 июня на Hugging Face, OpenRouter, ModelScope и build.nvidia.com.Под капотом — гибрид Mamba-Transformer с latent MoE: из 550 млрд параметров на каждый токен активны около 55 млрд, а Mamba-слои дают линейную сложность и нативный контекст в 1 млн токенов.
«Opus 4.7 подсматривает ответы!»: Datacurve раскритиковала бенчмарк SWE-Bench Pro — и выпустила свой
habr.com