DeepSeek показал, как урезать цену API-запросов почти вдвое

habr.com:

DeepSeek научила свою модель экономить ресурсы и урезать цену API-запросов почти наполовину. Компания представила экспериментальную версию своей модели — DeepSeek V3.2-exp — с новым механизмом Sparse Attention, который позволяет обрабатывать длинные запросы гораздо эффективнее.

Суть подхода в том, что модель не читает всё контекстное окно целиком, как это делают стандартные LLM, а быстро находит наиболее важные части текста и обращается только к ним.

Читать на habr.com Все новости от habr.com

Google предоставила разработчикам в API Gemini данные из «Карт»

Учёные доказали, что Wi-Fi-роутер может подглядывать за вами, как камера

Учёные показали, что спутниковую связь можно перехватывать оборудованием за 800 долларов

Мощнее DeepSeek-V3.1 и Qwen3: Alibaba выпустила ИИ с открытым кодом Ling-1T/Ring-1T

Google предоставила разработчикам в API Gemini данные из «Карт»

Учёные доказали, что Wi-Fi-роутер может подглядывать за вами, как камера

Учёные показали, что спутниковую связь можно перехватывать оборудованием за 800 долларов

Мощнее DeepSeek-V3.1 и Qwen3: Alibaba выпустила ИИ с открытым кодом Ling-1T/Ring-1T

Microsoft показала новую модель для симуляции поведения пользователя в диалоге

Figure AI показала нового человекоподобного робота

DeepSeek R1, Claude Sonnet 4 и Genie-3 вошли в список лучших изобретений 2025 года