NVIDIA ускорила языковую модель в 4 раза: вышла Nemotron-Labs Diffusion

habr.com

habr.com:

NVIDIA выпустила открытое семейство языковых моделей Nemotron-Labs Diffusion — на флагманском GPU B200 они генерируют 865 токенов в секунду, в 4 раза быстрее обычной токен-за-токеном генерации на том же железе и без потери качества.

Линейка включает модели на 3, 8 и 14 миллиардов параметров, плюс мультимодальный вариант на 8 миллиардов с поддержкой картинок.Главная идея — режим, который в NVIDIA называют self-speculation (самоспекуляция).

Читать на habr.com Все новости от habr.com

Google выпустила DiffusionGemma — открытую языковую модель, которая генерирует текст как картинку

Глава Anthropic: ИИ нужно регулировать как авиацию — с правом блокировать модели

DeepSeek дообучили без Nvidia: 1000 Ascend 910C и 1500 итераций без сбоев

Несколько копий Claude Fable 5 устроили войну друг с другом: странные эпизоды из system card модели

Глава Anthropic: ИИ нужно регулировать как авиацию — с правом блокировать модели

Google выпустила DiffusionGemma — открытую языковую модель, которая генерирует текст как картинку

DeepSeek дообучили без Nvidia: 1000 Ascend 910C и 1500 итераций без сбоев

Несколько копий Claude Fable 5 устроили войну друг с другом: странные эпизоды из system card модели

ИИ Nemotron 3 Ultra от Nvidia доступен бесплатно на OpenRouter

Память подорожала в 6 раз, а Morgan Stanley предупреждает о новой угрозе — чипфляции

ИИ Google Gemma 4 12B запускается на ноутбуке с 16 ГБ и почти догоняет модель вдвое крупнее

ИИ пишет код, чтобы искать в разы эффективнее: новая технология Perplexity

США хотят проверять ИИ-модели на киберопасность до релиза: указ Трампа

Тело — китайское, мозг — от NVIDIA: вышел первый гуманоид на открытой платформе

NVIDIA представила Nemotron 3 Ultra: открытая 550B-модель, до 5 раз быстрее в своем классе

MiniMax выпустила M3: открытая мультимодальная модель с контекстом 1M токенов

Вышел локальный ИИ-агент для смартфонов: LFM2.5-8B-A1B обходит модели вчетверо больше

«ИИ не уволит, а ускорит в 10 раз»: глава Anthropic отменил прогноз про «кровавую баню» для белых воротничков

Claude Mythos выйдет в ближайшие недели — модель круче Opus наконец-то откроют для всех

«Делайте в 3-4 раза больше, а не увольняйте»: Хассабис — компаниям, заменяющим инженеров AI

DeepSeek уронил цены в 4 раза на свою самую мощную модель. Но есть нюанс

OpenClaw на базе DeepSeek сам переписал свой код — и стал работать в 2,4 раза лучше

Представлен Qwen3.7-Max. ИИ-агент за 35 часов в 10 раз ускорил GPU-ядро без человека

NVIDIA зарабатывает почти миллиард долларов в день — «продавец лопат» ставит рекорд за рекордом

Вышла видеомодель Google Gemini Omni: «превратит что угодно во что угодно»

«ИИ ускоряет работу в 3 раза»: METR опросил инженеров — и засомневался в их ответах

Поддельная модель OpenAI воровала пароли, крипту и сессии Discord

OpenAI представила первую голосовую модель с интеллектом GPT-5

Composer тренирует Composer: Cursor использовал старую модель для обучения новой

На 52,5% галлюцинаций меньше: вышла GPT-5.5 Instant

Правительство США хочет первым получать доступ к новым ИИ-моделям

Теперь на Snapdragon X2: Microsoft представила обновленные Surface Pro и Surface Laptop

Последний шанс получить их: в июле каталог PS Plus потеряет 12 игр, среди которых Risk of Rain 2 и Tropico 6

Удивительное открытие на дне океана: почему в одном месте собралось так много китов

Врач назвал 10 лучших продуктов с витамином D

Разработана куртка, способная добывать влагу из воздуха

Компании платят индийцам за работу по дому под цифровую запись действий

Samsung может начать производство чипов для Neuralink — первый контракт с компанией Илона Маска

Четыре самые полезные ягоды назвали ученые

Как правильно мыть овощи и фрукты – врач

Ошибка длиною в 30 лет: самая высокая женщина узнала новый диагноз

Семья огров за решеткой и поющий Осел: представлен новый тизер мультфильма Shrek 5

В 1579 пакетах Arch Linux обнаружили вредоносные коммиты

Бывшего сотрудника IT-отдела школьного округа приговорили к тюрьме за кибератаку

Binance может лишиться шанса получить лицензию MiCA в ЕС — Reuters

Одно из самых впечатляющих астрономических событий десятилетия приближается к Европе

Commodore Callback 8020: раскладушка за $500, которая научит вас жить без соцсетей

MrBeast стал первым блогером на YouTube с более чем 500 млн подписчиков

Lenovo выпустила недорогие открытые наушники TA410 с автономностью до 48 часов

Пара покинула свою страну и переехала в дом без окон и дверей на Бали

AdGuard: удаление поддержки расширений Manifest V2 из Chromium не приведет к прекращению работы блокировщиков рекламы

«Амодеи отказался исправить Claude Fable 5»: в Белом доме объяснили блокировку мощнейшей модели Anthropic

Релиз BATorrent 4.0 — BitTorrent-клиента, созданного на C++, Qt 6 и libtorrent-rasterbar

Компания Waymo разработала модель Reference Driver, которая послужит эталоном для сравнения систем автономного вождения

Выпуск обновления Wine 11.11

Блокировка Fable 5 оказалась временной: США обещают вернуть доступ через несколько недель

Всего три ингредиента – как сделать копеечный капкан для комаров

Coinbase запустила инструмент для управления торговлей ИИ-агентами

GLM-5.2 уже доступна: 1M контекста и открытые веса на следующей неделе

Более 150 ведущих мировых математиков опубликовали «Лейденскую декларацию»

Redmi Turbo 5 выходит на глобальный рынок: HyperOS 3 и защита от всего на свете

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA