Granite 4: IBM представила линейку маленьких, но шустрых LLM

habr.com:

Пока OpenAI, Anthropic и Meta меряются миллиардами параметров, IBM внезапно решила сыграть в другую игру, представив Granite-4.0 — набор маленьких, но шустрых LLM.Вместо гигантов под сотни миллиардов параметров, IBM выкатила:Micro (3B) — ультралёгкий вариант, легко запуститься на ноутбуке.Tiny (7B/1B активных) — компактный MoE, экономит память и токены.Small (32B/9B активных) — самая большая из линейки, но всё равно «малышка» по сравнению с топовыми LLM.Фишка этой линейки моделей в гибридной Mamba-архитектуре: модель отключает лишние блоки и работает быстрее, при этом сохраняя длинный контекст (до 128K).

Может, именно этот «обратный ход» IBM и станет трендом: меньшее количество параметров, но больше пользы на практике? Granite-4.0 H-Small и Micro неожиданно обгоняют гигантов вроде Llama-3.3-70B и Qwen3-8B по Retrieval-Augmented Generation (73 и 72 против 61 и 55).

Читать на habr.com Все новости от habr.com

IBM представила компактные LLM для кибербезопасности

DeepSeek представил эффективный и дешевый ИИ для распознавания документов

Razer представила Phantom White — стильную линейку полупрозрачной геймерской периферии с ретро-футуристическим дизайном и RGB-подсветкой

Nvidia представила самый маленький AI-суперкомпьютер за 3999 долларов

IBM представила компактные LLM для кибербезопасности

DeepSeek представил эффективный и дешевый ИИ для распознавания документов

Nvidia представила самый маленький AI-суперкомпьютер за 3999 долларов

Андрей Карпатый представил nanochat — проект полного цикла создания LLM всего за 100 долларов

Casio пополнит линейку премиальных часов Oceanus Manta двумя моделями Calm Night с сапфировым стеклом, вручную обработанным японскими мастерами

IBM встроит ИИ Anthropic в свои продукты

Anthropic и IBM объединяются для работы с корпоративными клиентами в сфере искусственного интеллекта