DeepSeek предложила способ обучать ИИ без роста нагрузки на память
Китайская компания DeepSeek опубликовала научную работу, в которой предложила новый метод обучения нейросетей под названием mHC (Manifold-Constrained Hyper-Connections).
Главное достижение — возможность кратно расширить "пропускную способность" нейросети, сохранив при этом стабильность обучения и контроль над потреблением памяти.
habr.com