технологии экономика интересное стартап крипто токен

DeepSeek вызвал истерику у американских ИИ корпораций

Сегодняшняя новость настолько значима, что я не могу обойти её стороной. Расскажу вам несколько интересных фактов, связанных с китайской нейронной сетью DeepSeek, которая буквально встряхнула мировой технологический ландшафт. Почему модель от DeepSeek R1 за сутки стала лидером? Успеху DeepSeek во многом способствовала новая архитектура Multi-head Latent Attention (MLA), которая позволила сократить стоимость обучения на 90%, игнорируя 95% ненужных данных.

Вопрос остаётся открытым: это гениальное упрощение или просто экономия на алгоритмах? Как бы то ни было, результат поражает, что DeepSeek обогнал ChatGPT по всем основным бенчмаркам.

DMCA