Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

habr.com:

По мнению специалистов Nvidia, индустрия слишком увлеклась крупными языковыми моделями (LLM) для работы агентов — подходом, который, как они утверждают, экономически и экологически нежизнеспособен.В недавней научной статье они предлагают пересмотреть стратегию: большинство агентов, уверены авторы, могут работать не хуже, если использовать компактные языковые модели (SLM), и призывают компании изменить подход.В 2024 году рынок API LLM для агентных систем оценивался в 5,6 млрд $, но расходы на облачную инфраструктуру для их работы достигли 57 млрд $ — разрыв 10 к 1. «Эта операционная модель так глубоко вросла в индустрию, что стала фундаментом для масштабных капитальных ставок», — пишут исследователи.SLM, которые в Nvidia определяют как модели с числом параметров менее 10 млрд, «по сути, обладают достаточной мощностью», «изначально лучше подходят для практического применения» и «неизбежно экономичнее» для большинства агентных задач.Исследователи утверждают, что компактные модели нередко способны работать наравне с куда более массивными.

Они приводят пример Phi 2 от Microsoft, которая, по их словам, сопоставима с LLM на 30 млрд параметров в задачах логики и программирования, но при этом работает в 15 раз быстрее.

Читать на habr.com Все новости от habr.com

Nvidia и Carbon Robotics показали роботрактор для уничтожения сорняков

Nvidia выпустила «мозг для робота» — суперкомпьютер Jetson AGX Thor стоимостью $3499

Framework представила свой первый игровой модульный ноутбук с Nvidia RTX 5070

Nvidia GB300: 288 ГБ, PCIe 6, 1400 Вт — тот случай, когда «ещё больше всего» действительно работает

Nvidia и Carbon Robotics показали роботрактор для уничтожения сорняков

Nvidia выпустила «мозг для робота» — суперкомпьютер Jetson AGX Thor стоимостью $3499

Framework представила свой первый игровой модульный ноутбук с Nvidia RTX 5070

Nvidia GB300: 288 ГБ, PCIe 6, 1400 Вт — тот случай, когда «ещё больше всего» действительно работает

Конденсатор NVIDIA RTX 5090 взорвался и погнул радиатор без игровой нагрузки: "Это еще "захватывающий опыт", или уже "нейронный рендеринг?"

NVIDIA увеличила выручку до $46,7 млрд во II квартале

Серверы Nvidia GB200 NVL72 пока не справляются с обучением передовых ИИ — SemiAnalysis