DeepSeek-V3.2-Exp: китайцы снова мутят что-то хитрое

habr.com:

DeepSeek выпустили экспериментальную модель DeepSeek-V3.2-Exp — видимо, промежуточный шаг к их следующему «монстру». Главное новшество — DeepSeek Sparse Attention: хитрый способ сделать работу трансформеров на длинных текстах быстрее и дешевле.Если по-простому: модель учится «не тратить внимание впустую».

Вместо того чтобы пересчитывать все связи между словами, она обрабатывает только важные — и при этом почти не теряет качество ответа.

Читать на habr.com Все новости от habr.com

В monobank снова был сбой из-за массовых поисков лимонов

Пользователи снова сообщили о расплавленных кабелях MSI для RTX 5090

Изображение основателя Apple Стива Джобса появится на однодолларовой монете США

Сооснователь Thinking Machines Lab переходит в компанию Цукерберга

В monobank снова был сбой из-за массовых поисков лимонов

Пользователи снова сообщили о расплавленных кабелях MSI для RTX 5090

Изображение основателя Apple Стива Джобса появится на однодолларовой монете США

Сооснователь Thinking Machines Lab переходит в компанию Цукерберга

Секреты долголетия от карпатского целителя и их научное обоснование

Магазин приложений Pebble снова заработал

Снова? Хакеры заявили о масштабном взломе Nintendo

Основатель журнала «Хакер» написал открытое письмо к главе Минцифры из-за запрета на данные, связанные с практикой ИБ

IT‑специалист из Китая и один из основателей компании «Рулла» сравнил WeChat и Max

Модель Genesis и Fractal. IT-группа Sigma Software Group запустит два новых бизнеса. Какая стратегия у основателя Валерия Красовского?

Монастыри и университеты. Каким должно быть высшее образование в Украине, чтобы пережить ИИ-революцию и вызовы демографии? Мнение редактора-основателя Forbes Ukraine

Магнитные бури снова надвигаются на Землю: кто в группе риска и как себя защитить

Microsoft снова объединяет свои команды разработчиков Windows

Основатель iRobot не подходит ближе, чем на 3 метра к современным "ходячим" роботам

У Starbreeze снова проблемы — авторы Payday отменили игру по Dungeons & Dragons и проводят масштабные сокращения

Google Japan снова удивляет: представлен концепт клавиатуры с дисковыми циферблатами вместо клавиш

Сооснователь XRP Ledger уйдет с должности CTO Ripple после 13 лет работы

Сооснователь Palantir Питер Тиль: «контроль над ИИ ведет к Антихристу»

Основатель Rockstar назвал лучшую игру студии и объяснил судьбу Bully 2

Сооснователь Syncracy назвал DAT-компании потенциальными «Berkshire Hathaway блокчейнов»

BMW утверждает, что даже китайцы не могут сравниться с её скоростью разработки

В Alibaba вернулся ее основатель Джек Ма

GTA научит! Профессор из университета Теннесси разработал курс по истории США, основанный на знаменитой серии