Языковой модуль DeepSeek-R2 могут запустить уже через 2 дня
Дата стала известна после взаимодействия с собственной ИИ-моделью компании и указывает на скорый релиз — всего через несколько дней после выхода ChatGPT-5.DeepSeek-R2 обещает серьезный скачок в архитектуре благодаря использованию более продвинутой системы Mixture of Experts (MoE) и улучшенной сети управления (gating network), что позволит эффективнее обрабатывать задачи с высокой нагрузкой на вычислительные ресурсы.
По данным источников, модель может масштабироваться до 1.2 трлн параметров — почти вдвое больше, чем у DeepSeek-R1 с его 671 млрд, но все же меньше, чем у ChatGPT-4/5, имеющих свыше 1.8 трлн параметров.Важной особенностью нового модуля станет полный отказ от зарубежных чипов — обучение проводилось исключительно на процессорах Huawei Ascend 910B.
ilenta.com