Huawei Nvidia общество самит мода и стиль крипто токен

DeepSeek-V4: Тихий гигант

Привет, Хабр! 👋 Сегодня разбираем, что принесла новая версия: прорыв или эволюция? Действительно ли «триллион параметров» — это не маркетинг?

И главное — стоит ли переключаться с Claude или GPT?ПараметрDeepSeek-V4 FlashDeepSeek-V4 Pro Общее количество параметров ~400 млрд~1.6 трлн Активные параметры на токен ~12 млрд~49 млрд Экспертов на слой (MoE) 96384 Активных экспертов на токен 36 Контекстное окно 1 000 000 токенов1 000 000 токенов KV Cache (при 1M контексте) ~8% от V3.2~10% от V3.2 Вычислительные затраты (FLOPs) ~22% от V3.2~27% от V3.2 Модальности ТекстТекст Лицензия MITMIT Цена API (вход/выход) $0.14 / $0.28 за 1M токенов$1.74 / $3.48 за 1M токеновГлавная инновация — эволюция Mixture-of-Experts.

DMCA