Гибридный Deepseek v3.1 обошёл модель R1 в тестах на рассуждение
v3.1 создана на основе предыдущей версии Deepseek‑v3, но получила дополнительно 840 миллиардов токенов для обучения. Это должно улучшить понимание длинных контекстов и повысить результативность на сложных заданиях.
Кроме того, Deepseek обновила токенизатор и чат‑шаблоны.Deepseek‑v3.1 позволяет переключаться между двумя режимами. «Think mode» (deepseek‑reasoner) заточен под многошаговые рассуждения и использование инструментов, а «non‑think mode» (deepseek‑chat) предназначен для более простых задач.
habr.com