Гибридный Deepseek v3.1 обошёл модель R1 в тестах на рассуждение

habr.com

habr.com:

v3.1 создана на основе предыдущей версии Deepseek‑v3, но получила дополнительно 840 миллиардов токенов для обучения. Это должно улучшить понимание длинных контекстов и повысить результативность на сложных заданиях.

Кроме того, Deepseek обновила токенизатор и чат‑шаблоны.Deepseek‑v3.1 позволяет переключаться между двумя режимами. «Think mode» (deepseek‑reasoner) заточен под многошаговые рассуждения и использование инструментов, а «non‑think mode» (deepseek‑chat) предназначен для более простых задач.

Читать на habr.com Все новости от habr.com

Grok 4 обошел GPT-5-Pro и Gemini 2.5 в прогнозах будущих событий

DeepSeek готовит автономного AI-агента

DeepSeek готовится запустить ИИ-агента к концу года

DeepSeek ввела маркировку для всего контента, созданного с помощью её ИИ-продуктов

Grok 4 обошел GPT-5-Pro и Gemini 2.5 в прогнозах будущих событий

DeepSeek готовит автономного AI-агента

DeepSeek готовится запустить ИИ-агента к концу года

DeepSeek ввела маркировку для всего контента, созданного с помощью её ИИ-продуктов

Собирается ли ИИ захватывать мир - журналисты спросили у ChatGPT, Deepseek, Claude и Gemini

DeepSeek-V3.1 теперь можно запускать локально

Фреймворк BeyondWeb (Datology AI) перестраивает веб-документы для лучшего обучения моделей

Когда ИИ слишком уж соглашается: Spiral-Bench разоблачает, какие модели склонны подпитывать бред

Tesla обновляет ассистента в китайских электромобилях с помощью ИИ от DeepSeek и ByteDance

Meta✶ привлекла Midjourney к разработке своих ИИ-моделей изображений и видео

После выхода DeepSeek-V3.1 акции китайских производителей полупроводников взлетели на 10-20%

Релиз открытой модели ByteDance: Seed-OSS-36B с контекстом в 512 000 токенов

DeepSeek V3.1 выпущен официально. Дешевая модель с улучшенными агентскими функциями

Каким получился обновленный DeepSeek — скорость и дешевизна вместо бенчмарков

Nvidia выпускает компактную открытую модель Nemotron-Nano-9B-v2 с переключаемыми рассуждениями

DeepSeek получил обновление. К сожалению, пока не до R2

Nvidia и Национальный научный фонд США создают открытые ИИ-модели для исследователей

DeepSeek-R1 провалил проверку на здравый смысл в новом бенчмарке

Модель o3 обходит более новый GPT 5 Chat в задачах с Word, Excel и почтой

ChatGPT 5 не холоден к вам — просто у него нет теста на эмоции

DeepSeek R2 задерживается из-за отсталости китайских чипов — FT

Модель MolmoAct от Ai2, мыслящая в 3D, бросает вызов Nvidia и Google

Меню выбора моделей ChatGPT вернулось — и всё запутаннее, чем кажется

Instella Math: языковая модель AMD с поддержкой рассуждений

Языковой модуль DeepSeek-R2 могут запустить уже через 2 дня

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

Сенаторы США заявили о необходимости расследовать китайскую ИИ-модель DeepSeek из-за угрозы нацбезопасности

Чем полезны грибы для организма - ответ врача

Во всех новых iPhone улучшили фронтальную камеру: детали

Опасные виды головной боли назвали врачи

Ученые назвали вирус, которым инфицированы почти все люди на планете

Определена десятка самых продаваемых смартфонов в мире по итогам квартала

BOE выпустила усовершенствованный дисплей ADS Pro (IPS LCD) для смартфонов

Сборник Mortal Kombat: Legacy Kollection дебютирует 30 октября — фанатам файтингов и ретро-игр не стоит пропускать этот релиз

Какой шоколад полезнее для здоровья – ответ диетологов

Украинец открыл новую комету SWAN25B и она уже удивила астрономов своей яркостью

Фотомаркетинг Apple iPhone 17: почему три равно восьми и что такое "оптическое качество"

Продукты, улучшающие работу мозга, назвали диетологи

Названы десять самых быстрых реактивных самолетов

ТОП-5 способов бороться со стрессом

Roblox запускает аналог TikTok и новые инструменты на основе ИИ

Крутые фото гарантированы: новейший флагман OPPO Find X9 Pro получит впечатляющий набор камер, среди которых 200 МП перископический сенсор

Зевота может указывать на опасные болезни – эксперты

Claude научили создавать и редактировать файлы

Снятым с продажи 30-ваттным адаптером Apple комплектуется 2 устройства

"Боже мой, нас бомбят": огромный кабан ворвался в дом и атаковал хозяина и его собаку (ВИДЕО)

Yandex Cloud проведёт 24 сентября 2025 года конференцию Yandex Neuro Scale 2025

Мир науки потрясен: ученые нашли древнейшие окаменелости в истории

Появились подробности об экране смартфона Samsung Galaxy S26 Ultra

Кошка, которую считали мифом, реально существует (ВИДЕО)

В «Лаборатории Касперского» пояснили, что Max даже несколько «отстаёт» по своим «аппетитам» от других мессенджеров

“Революция зумеров” в Непале: дебаты в Discord и выбор главы правительства с помощью ChatGPT

Новый взгляд на происхождение жизни на Земле: инопланетяне или абиогенез

В Южной Корее одиноким пенсионерам выдают «робовнуков» с ChatGPT

Apple Watch Series 11: 24 часа автономной работы оказались игрой с цифрами

Почему мы до сих пор одиноки: ученые объяснили, где могут "прятаться" инопланетяне

СМИ: в Непале протестующие использовали ChatGPT для выбора премьер-министра

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA