3 бита хватит: Google ускорила работу LLM за счет сжатия кэша

habr.com

habr.com:

Google Research представила TurboQuant — алгоритм, который сжимает внутренний кэш больших языковых моделей до 3 бит. При этом качество ответов модели не падает, а дообучение не требуется.

Работу покажут на конференции ICLR 2026.Когда языковая модель обрабатывает длинный текст, она сохраняет промежуточные данные в так называемом кэше "ключ-значение" (key-value cache).

Читать на habr.com Все новости от habr.com

Страх и вранье: топ-менеджер OpenAI раскритиковала Anthropic в утекшем меморандуме

DeepMind наняла философа, чтобы подготовиться к AGI

ИИ пишет код на уровне людей, но не умеет читать часы: Стэнфорд выпустил AI Index 2026

70 страниц Slack: что Суцкевер собрал на Альтмана перед увольнением 2023-го

Страх и вранье: топ-менеджер OpenAI раскритиковала Anthropic в утекшем меморандуме

DeepMind наняла философа, чтобы подготовиться к AGI

ИИ пишет код на уровне людей, но не умеет читать часы: Стэнфорд выпустил AI Index 2026

70 страниц Slack: что Суцкевер собрал на Альтмана перед увольнением 2023-го

Трое из трех: ИИ-агент CodeWall вскрыл всю «Большую тройку» консалтинга

«Вайб-кодинг работает, и мне это не нравится»: журналист Register о 7 неделях с Claude Code

Claude Mythos первым справился со взломом, на который уходит 20 часов

Anthropic заблокировал создателя OpenClaw — он работает в OpenAI и тестировал совместимость

OpenClaw снова работает с подпиской Claude — через обертку вокруг Claude Code CLI

OpenAI, Anthropic и Google скоординировались против DeepSeek и других китайских лабораторий

Выбросил месяц ИИ-кода и начал заново: инженер Google честно рассказал о работе с Claude Code

Claude не хватает серверов — но Anthropic сознательно не торопится закупать новые

Вышла Google Gemma 4 — открытая модель с 31 млрд параметров обходит ИИ вдвое крупнее

Perplexity обвинили в сливе запросов пользователей в Google и Meta* — подан коллективный иск

ИИ-стартап за $10 млрд взломан через Python-библиотеку: Mercor подтвердила инцидент с LiteLLM

В 20 раз меньше кубитов на взлом криптовалют: новые расчеты Google Quantum AI

ИИ-агент Смит захватил Google изнутри — доступ пришлось ограничить

Локальная Gemini на iPhone? Сделка с Google оказалась глубже, чем все думали

Palantir стал постоянным поставщиком ИИ для Пентагона. Внутри все еще работает запрещенный Claude

Google превратил AI Studio в IDE для вайб-кодинга — с бэкендом, базами и мультиплеером

OpenAI снова объявляет «красный код» — теперь из-за Anthropic, а не Google

Себастьян Рашка запустил визуальный справочник архитектур LLM — от DeepSeek до GLM-5

Пока Anthropic и OpenAI ссорятся из-за контракта с Пентагоном, Google тихо занимает их место

ИИ Google улучшил 5 границ в теории Рамсея — некоторые держались с 2006 года

Meta* отложила ИИ-модель Avocado: она проиграла Google и OpenAI на внутренних тестах

Google обучит ИИ для борьбы с суперинфекциями

Карпати написал ИИ-агента, который ускорил обучение GPT-2 на 11%

Почему собака внезапно может стать агрессивной - ответ ветеринаров

Разработчики назвали дату выхода экшен-RPG «Былина»

МВФ призывает страны «быть начеку» из-за растущих рисков, связанных с ИИ

Инвесторы сомневаются в стратегии OpenAI на фоне роста Anthropic

Неочевидный сигнал крепких отношений, о котором говорят исследователи

Кости, пушки и униформа – что нашли на дне гавани спустя два столетия

Casio представила ограниченную серию Oceanus Manta с титановым корпусом и сапфировым безелем

OpenAI представила обновление Codex для разработчиков: какие функции стали доступны пользователям

Продукты, укрепляющие организм, назвали диетологи

Meta тестирует обновленный дизайн веб-версии Threads с поддержкой личных сообщений

Сколько шагов в день нужно, чтобы снизить риск ранней смерти

Anthropic обсуждает мораль и религию для Claude с христианскими лидерами

Claude Code теперь работает сам: Anthropic запустила Routines с триггерами по cron, API и GitHub

iPhone 18 Pro получит долгожданную переменную диафрагму

Amazon покупает Globalstar для усиления спутниковой связи и конкуренции со Starlink

Bambu Lab представила X2D — флагманский 3D-принтер с двумя экструдерами и гибридной подачей филамента

AI-специалисты массово возвращаются из США в Китай

ТОП-8 опасных побочных эффектов пищевых добавок и витаминов

Как ускорить работу смартфона - эксперты назвали простой способ

Во время съемки для Apple Vision Pro погибла парализованная путешественница

Летом 2028 года: Activision и Paramount назвали дату премьеры фильма Call of Duty

DJI Osmo Pocket 4: Дюймовый сенсор и 240 кадров в секунду для тех, кто ценит стабильность

Студия Watt показала первый геймплейный ролик игры Tsarevna

Ежедневные ритуалы по-настоящему счастливых и успешных людей

Когда Земля станет непригодной для жизни - ответ ученых

Продукты, которые не стоит есть на ужин, назвали врачи

Представлено умное кольцо Smalth Titanium Lava с эффектом застывшей лавы

Суд признал банкротом ООО «Майкрософт Рус»

Samsung Galaxy A27: бюджетник, наконец-то перестав стесняться своего внешнего вида

Москва в руинах, диктатура неонацистов и мрачность нового уровня — представлен дебютный трейлер Metro 2039

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA