Ai2 предложил способ обновлять навыки LLM по одному без полного переобучения

habr.com

habr.com:

Институт Allen Institute for AI представил метод BAR — новый подход к посттрейну, который позволяет добавлять или улучшать отдельные навыки модели без полного ретрейна.Суть в том, что модель разбивается на доменных «экспертов» (математика, код, tool use и т.д.), которые обучаются независимо, а затем объединяются в MoE-систему через обучаемый роутер.Главное преимущество — отсутствие «разрушения» уже выученных навыков.

Например: обновление код-эксперта с помощью RL даёт +16.5 пункта к качеству программирования практически без влияния на другие области добавление RL к математическому эксперту даёт +13 пунктовВ классическом пайплайне любое улучшение требует переобучения всей модели, и стоимость растёт квадратично.

Читать на habr.com Все новости от habr.com

Gmail, Salesforce и LinkedIn в одном агенте: OpenAI выпустил Codex для Chrome

«Маркетинговый хайп»: из пяти уязвимостей Mythos в curl подтвердилась одна

Главный критик LLM почти похвалил Claude Mythos. Почти

«120 яиц для кафе без плиты»: ИИ запустил кофейню в Стокгольме

Gmail, Salesforce и LinkedIn в одном агенте: OpenAI выпустил Codex для Chrome

«Маркетинговый хайп»: из пяти уязвимостей Mythos в curl подтвердилась одна

Главный критик LLM почти похвалил Claude Mythos. Почти

Пентагон пустил 8 ИИ-моделей в свои секретные сети. Без Anthropic — но не совсем

Всего 20 минут и $12: как исследователь отравил передовые LLM несуществующими данными

Хассабис предложил необычный тест на AGI — открыть теорию относительности во второй раз

Роботы-собаки с головами Маска и Безоса «заполнили» музей в Берлине

300-400 млн смартфонов в год: OpenAI готовит прямого конкурента iPhone — без приложений и App Store

Каждому тикету — по агенту: OpenAI запустила Symphony, чтобы Codex закрывал задачи без человека

СМИ: «Минпромторг предложил увеличить долю обязательных госзакупок отечественных принтеров и МФУ с 30% до 50%»

Продукты, которые способны быстро поднять настроение

Microsoft объяснила отказ от официального способа активации Windows 10/11 без интернета

ИИ PRET определяет 18 типов рака по 8 слайдам без переобучения

«Крестный отец ИИ»: мы строим машину без руля

Google анонсировала TPU 8: два ускорителя вместо одного — для обучения и ИИ-агентов

ИИ-лаборатория Джеффа Безоса готовится привлечь $10 млрд финансирования

Кибербезопасность важнее запрета Трампа. Агентства США тестируют Claude Mythos

OpenAI представила GPT-5.4-Cyber для специалистов по кибербезопасности

На 18 месяцев без новых дата-центров: парламент штата Мэн принял первый в США мораторий на крупные ЦОД

WLFI предложил сжечь более 4,5 млрд токенов с блокировкой активов до 5 лет

«Самая способная кибермодель, которую мы оценивали»: британские власти созывают совещание из-за Claude Mythos

Amazon покупает Globalstar за 11,57 млрд долларов: Джефф Безос идет ва-банк против Starlink

«OpenClaw для всех»: Poke запустил ИИ-агента без терминала и установки

OpenAI предложила дать каждому американцу долю в прибыли от ИИ

В OpenClaw за полтора месяца нашли шесть дыр в одном модуле. И это не конец

В Codex ввели pay-as-you-go тариф без лимитов на запросы

Anthropic убрала «безлимит» для агентных сценариев Claude

Репутация дороже чипов: архитектор Qwen собирает миллиарды на новую ИИ-лабораторию

RPCS3 обновила свои правила, чтобы бороться с наплывом низкокачественного кода, сгенерированного ИИ

Apple готовит второе поколение «безрамочного» дисплея для юбилейного iPhone

LG выпустила 115-дюймовую «стену» QNED: когда размер имеет значение (и стоит как кроссовер)

Xynova Flex 2: китайцы научили роборуки уверенно держать 12-килограммовую гантель и не ломать яйца

Huawei Pura 90 бьет рекорды: китайцы скупают флагманы на 70% быстрее, чем раньше

Франкенштейн с паяльником: как энтузиаст «вылечил» жадность NVIDIA в RTX 3070

Куриная грудка или бедро — что полезнее

В каком сыре самое высокое содержание белка

Какие витамины могут привести к выпадению волос

Страх постареть может ускорять клеточное старение - ученые

Биологическое старение зависит от времени приема пищи — исследование

ITFB Group развернула региональный архив для ЯНАО на базе дистрибутива ГИС ЦХЭД

Раскрыты характеристики и цены смартфона HMD Vibe 2 5G

Неожиданный совет стоматолога – что нельзя делать после еды

Идеальная гонка для всех и лучшая часть серии: критики в восторге от Forza Horizon 6 и ставят игре высочайшие оценки

eBay отказался от поглощения ретейлером видеоигр GameStop за $56 млрд

Как понять, что у вашей собаки что-то болит - 17 тревожных сигналов

Самый большой QNED в истории LG: представлен впечатляющий 115” телевизор с передовыми AI-функциями и частотой до 330 Гц (в режиме Motion Booster)

Когда начинается старость - назван неожиданный возраст

Исповедь пилота – что стоит за работой в кабине самолета

Процессор на стероидах для Марса: NASA тестирует чип, который в 500 раз быстрее текущих решений

Погружение началось: Subnautica 2 уже доступна на PC и Xbox Series и получает отличные отзывы игроков

Какой цвет в интерьере провоцирует усталость и стресс

Регулярный дневной сон сокращает продолжительность жизни - ученые

Желудок будет работать лучше - какой напиток стоит пить после ужина

Microsoft: функция разгона процессоров в Windows 11 не новая — аналоги есть в macOS и Linux

Thinking Machines создаёт слушающий и говорящий ИИ

Apple раскритиковала планы ЕС по открытию Android для сторонних ИИ-сервисов

Эксперт оценил вероятность принятия CLARITY Act до конца года

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA