runawayllm общество самит google крипто runawayllm

Cerebras разогнал Google Gemma 4 до 1500 токенов/с — и научил видеть картинки

Компания Cerebras, известная гигантскими ИИ-чипами размером с кремниевую пластину, запустила модель Gemma 4 на своей платформе инференса со скоростью свыше 1500 токенов в секунду.

Пока это приватное превью, общий доступ обещают открыть до конца месяца. Это не первая модель, которую Cerebras запускает на повышенной скорости, но первая с поддержкой мультимодальности: на прием она может получать не только текст, но и картинки.Cerebras приводит примеры, где сочетание скорости и мультимодальности меняет ощущения от продукта:разбор плотного дашборда или страницы документа с выделением главного и структурированным ответом — сразу, а не после паузы;суммаризация длинного отчета или техзадания так быстро, что можно прочитать, среагировать и переспросить за один присест;"скриншот → патч": модель получает сломанный интерфейс, исходник и ошибку из консоли и возвращает минимальную правку.В цифрах Cerebras подает это так: их Gemma 4 выдает свыше 1500 токенов в секунду против примерно 100 у Claude Haiku — то есть быстрее в 15 раз при сопоставимом качестве.

DMCA