Представлен DeepSeek-V3.2-Exp: в разы дешевле при той же производительности
Представлена экспериментальная модель DeepSeek-V3.2-Exp, в которой разработчики впервые опробовали новую схему разреженного внимания (DSA).
Модель доступна в веб-версии и приложениях (раскатка может идти поэтапно), API, а также на Hugging Face.Особенность DSA в том, что схема выбирает лишь самые «важные» позиции в длинном контексте и считает полное внимание только по ним — поэтому время и стоимость растут почти линейно по числу выбранных токенов, а не квадратично по длине всего текста.
habr.com