Gemma 4 стала быстрее в 3 раза без потери качества

habr.com

habr.com:

Google открыла веса вспомогательных моделей для всей линейки Gemma 4 — E2B, E4B, 26B MoE и 31B Dense. Они доступны на Hugging Face и Kaggle под Apache 2.0 и уже работают с transformers, MLX, vLLM, SGLang и Ollama.Стандартная генерация токенов устроена неэффективно: процессор большую часть времени тратит не на вычисления, а на перекачку весов модели из памяти.

Из-за этого даже мощные GPU простаивают, пока генерируется один токен.Speculative decoding решает это следующим образом: маленькая вспомогательная модель (drafter) набрасывает несколько следующих токенов сразу, а основная проверяет их за один проход.

Читать на habr.com Все новости от habr.com

Bitget стала Platinum Partner крупнейшего криптособытия Украины Incrypted Conference 2026

В Kodacode стала доступна Gemini 3.5 Flash

Мышь Logitech MX Master 4 стала поддерживать тактильную обратную связь в Windows 11

Для бизнеса в 2026 году быстрая окупаемость стала главным обоснованием ИТ-расходов

Bitget стала Platinum Partner крупнейшего криптособытия Украины Incrypted Conference 2026

В Kodacode стала доступна Gemini 3.5 Flash

Мышь Logitech MX Master 4 стала поддерживать тактильную обратную связь в Windows 11

Для бизнеса в 2026 году быстрая окупаемость стала главным обоснованием ИТ-расходов

Биржа BingX стала Platinum Partner главного криптоивента лета — Incrypted Conference 2026

Binance стала Diamond Partner конференции Incrypted Conference 2026

К2 Кибербезопасность запускает серию стримов для ИБ-специалистов

ИИ идет в автосервис – роботы меняют шины в два раза быстрее людей

Coinbase стала официальным эмитентом USDC в Hyperliquid

Хозяйки массово выбрасывают кухонные губки – стала известна причина

Идеальный полигон для ИИ: Google DeepMind стала совладельцем разработчиков EVE Online

Генерация изображений стала «магнитом» для пользователей ИИ-приложений — отчет

Криптобиржа Ирана Nobitex со связями с элитой стала инструментом обхода санкций — Reuters

Линейка iPhone 17 стала самой популярной в истории Apple

Роботы-собаки с головами Маска и Безоса «заполнили» музей в Берлине

Copilot сделает Claude Opus в 27 раз дороже

Демоверсия Final Fantasy VII Rebirth стала доступна на Xbox Series и Nintendo Switch 2 — пройдите две главы и оцените оптимизацию игры

Госдеп США против DeepSeek: как дистилляция ИИ стала дипломатическим оружием

Продукты, которые способны быстро поднять настроение

Трафик под контролем: как повысить эффективность мониторинга без потери качества

Математическая головоломка стала вирусной в соцсетях

Garmin ныряет глубже: обновленная версия дайверских умных часов Descent Mk3 стала еще умнее и выносливее

ИИ-лаборатория Джеффа Безоса готовится привлечь $10 млрд финансирования

ИИ стал оружием хакеров: кибератаки стали быстрее и сложнее

Blue Origin Джеффа Безоса впервые повторно использовала ракету New Glenn, но миссия закончилась неудачей

Alibaba vs Google: Qwen3.6-35B-A3B обходит Gemma 4-31B в кодинге, эрудиции и математике

Ужас перед простотой – как кнопка стала врагом в прошлом

Вышел Rhino Linux 2026.1

LG может рассмотреть продажу ТВ-бизнеса: обсуждения с Hisense вызвали волну слухов

Microsoft признала, что выделенная клавиша Copilot была не лучшей идеей: теперь её можно будет переназначить

Крах стереотипов – названы лучшие наушники по качеству звука

Amazon покупает Globalstar: Джефф Безос забирает долю Apple в спутниковом бизнесе

В Европе дебютировали Xiaomi Watch S5 — флагманские смарт-часы с легким и тонким стальным корпусом, ярким AMOLED-экраном и автономностью до 21 дня

Главную причину развития диабета назвали ученые

Ночные кошмары могут быть симптомом опасной болезни

Обновления BIOS от HP ломают дорогие ноутбуки

Ваши артерии "забиты" жиром и холестерином - 5 признаков

О неожиданной опасности смартфонов для зрения рассказали врачи

Один Claude пишет, другой проверяет: в Claude Code появился поиск уязвимостей в реальном времени

YouTube усиливает маркировку ИИ-контента: платформа станет прозрачнее

Юбилейные часы Casio Frogman получили ручную обработку и эксклюзивные материалы

Как мозг воспринимает время - исследование

Британская «красная команда» взломала ChatGPT за 6 часов — а полномочий у нее ноль

Минцифры РФ напомнило аккредитованным IT‑компаниям о сроке подтверждения статуса и налоговых льгот до 1 июня

Учёные поняли, как в 2010 году направление течения внешних слоёв ядра Земли изменилось на противоположное

«Невыездные» из-за ИИ: топ-менеджерам Alibaba и DeepSeek закрыли свободный выезд

СМИ: Krafton все же выплатит $250 млн авторам Subnautica 2 — издательство хочет завершить некрасивый конфликт

Продукты, которые повышают риск смертельной болезни, назвали диетологи

Как поздние ужины увеличивают риск рака, рассказали ученые

Пять продуктов, которые нельзя сочетать с рыбой, назвали врачи

Xiaomi 17T и 17T Pro дебютировали на глобальном рынке — «Мастера телефото» с камерами Leica и топовыми чипами от MediaTek уже доступны для покупки

Meta запускает Plus-подписки для Instagram, Facebook и WhatsApp — предлагаются супер-реакции, кастомизация иконок и анонимный просмотр Stories

КРЭТ и КАМАЗ представили электрозарядную станцию ФОРА ЭЗС-DC-4M мощностью 160 кВт для ночной зарядки электробусов

В MySQL закрыли 20-летний баг: его нашли в 2005 году, но очень долго не исправляли

«Базис» выпустил Basis Dynamix Cloud Control 5.5 и Basis Automation Studio 2.4

От каких пищевых привычек важно избавиться после 50 лет

Call of Duty: Modern Warfare 4 выйдет 23 октября — Activision представила эффектный анонсирующий трейлер и открыла предзаказы

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA