В llama.cpp добавили функцию для динамического переключения моделей без перезагрузки сервера

habr.com

habr.com:

Разработчики llama.cpp добавили поддержку router mode — режима, с помощью которого можно динамически загружать, выгружать и переключать несколько моделей без перезагрузки сервера.

В блоге Hugging Face отмечают, что чаще всего пользователи просили реализовать именно эту функцию.llama.cpp — легковесный HTTP-сервер для локального запуска языковых моделей, совместимый с эндпоинтами OpenAI.Чтобы воспользоваться функцией, надо запустить сервер в режим роутера без явного указания нужной модели:Если до этого пользователь скачивал модели с помощью llama-server -hf user/model, то они автоматически станут доступны из кэша (LLAMA_CACHE или ~/.cache/llama.cpp).

Читать на habr.com Все новости от habr.com

Леон Кеннеди — лучшая реклама Resident Evil Requiem: более 4 миллионов геймеров добавили хоррор в список желаемого

Представлен Swift Drive — необычный контроллер со встроенным рулевым колесом и кнопками для переключения передач

Samsung добавит своим флагманам поддержку аксессуаров для видеосъемки

В ChatGPT добавили тонкие настройки ответов модели

Леон Кеннеди — лучшая реклама Resident Evil Requiem: более 4 миллионов геймеров добавили хоррор в список желаемого

Представлен Swift Drive — необычный контроллер со встроенным рулевым колесом и кнопками для переключения передач

В ChatGPT добавили тонкие настройки ответов модели

Google готовит для запуска на всех Android-устройствах функцию Contextual Suggestions

Microsoft выпустила встроенную функцию Windows для роста производительности серверов

Компания Dockcase представила чехол для iPhone с картой памяти и дополнительным экраном для селфи

«Крестный отец ИИ» Янн ЛеКун запускает стартап ценой €3 млрд для создания моделей мира

VS Code добавляет поддержку Agent Skills для динамической автоматизации ИИ

В ChatGPT добавили магазин приложений — до 800 млн клиентов и пока без комиссии 30%

Microsoft позволит отключить функцию Smart App Control без переустановки Windows 11

Исследователи Huawei представили WindowSeat — диффузионный трансформер для удаления отражений на фотографиях

Онлайн-мероприятие IT Career Conf 25/26 от Neoversity: инсайды от топовых IT-работодателей и бонусы для участников

Оператор карт «Мир» добавит функцию офлайн‑оплаты по QR‑кодам, которые будут формироваться на смартфоне клиента

ИИ AlphaFold 3 нашел мишень для вакцины от оспы обезьян, которую годами не замечали ученые

В «Яндекс Картах» добавили режим «По шагам» для навигации по зонам с проблемами приёма сигнала GPS

В Homebrew добавили поддержку Flatpak

В «Яндекс Книгах» появилась функция, которая напоминает содержание предыдущих глав в аудиокнигах

Apple выпустила iOS 26.2: новые функции для подкастов, AirDrop, Liquid Glass и не только

В ChatGPT добавили поддержку некоторых функций Adobe Express, Acrobat и PhotoShop

Google представила лучшие расширения для Chrome в 2025 году: очень много ИИ и Photoshop

Яндекс Директ обновил инструмент для создания бесплатных лендингов, добавив в него новые возможности

Google запускает Workspace Studio для создания ИИ-агентов без кода

AWS внедряет функцию отработки отказа DNS для своего ненадежного Восточного региона США

YouTube запустил функцию «Обзор» для просмотренных видео

«Яндекс» выпустил климатический модуль для «Станции Мини 3 Про»

Разработчик выпустил Storm Search — плагин для VS Code с улучшенным глобальным поиском по кодовой базе

Qualcomm представила Snapdragon 8 Gen 5 — систему на кристалле для субфлагманов

Как идеально приготовить цветную капусту: советы от пяти шеф-поваров

TikTok запустила PineDrama: отдельное приложение с короткими эпизодическими сериалами

ТОП-5 продуктов, которые уменьшают аппетит

Новое исследование: минимальное число минут ходьбы, продлевающее жизнь

Овощ, который защищает от тромбов и снижает риск рака

Как кофе влияет на организм - ответ ученых

Anthropic открывает доступ к функции Claude Cowork для подписчиков Pro

OpenAI готовится запустить рекламу в ChatGPT для бесплатного плана и подписки Go

Пять главных обновлений серии Samsung Galaxy S26

Китай стандартизирует переработку батарей электромобилей

Dacia быстро разрабатывает городской электромобиль за €18 тыс. для Европы

Сколько нужно спать, чтобы жить дольше - исследование

Hyundai представила кемпер на основе модели Staria

Открытие ученых приоткрыло истинное происхождение человека

Sony представит новый аудиопродукт 21 января

Список продуктов и напитков, которые нельзя употреблять по вечерам

Netflix приобрел права на эксклюзивный показ фильмов и сериалов Sony Pictures

Канада снизит пошлины на китайские электромобили

Зарплаты разработчиков в 2026 году: эксперты прогнозируют рост на 5-20% сверх инфляции

Какая черта лица может указывать на склонность к деменции

Какие 4 признака на свадьбе могут предсказать будущий развод пары

В DCImanager появились новые возможности для планирования и размещения оборудования в стойках

Наушники Beats начал популяризировать звезда бейсбола из Los Angeles Dodgers

В каком ряду лучше сидеть в самолете - названы самые удачные места

Пентагон будет использовать Grok для повседневной работы

Первые признаки старости назвали ученые

Как люди смогут общаться с инопланетянами в случае их сигнала - ученые

Руководитель The Division Джулиан Герити покинул Ubisoft и займется развитием Battlefield

В Великобритании впервые поднялся в воздух автономный военный вертолет

Какое мясо может повысить риск развития рака - предупреждение врачей

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA