DeepSeek показал, как урезать цену API-запросов почти вдвое
DeepSeek научила свою модель экономить ресурсы и урезать цену API-запросов почти наполовину. Компания представила экспериментальную версию своей модели — DeepSeek V3.2-exp — с новым механизмом Sparse Attention, который позволяет обрабатывать длинные запросы гораздо эффективнее.
Суть подхода в том, что модель не читает всё контекстное окно целиком, как это делают стандартные LLM, а быстро находит наиболее важные части текста и обращается только к ним.
habr.com