Новая DeepSeek V3: рекорды в бенчах, кодинг лучше Claude и GPT-4.5

habr.com

habr.com:

Позавчера DeepSeek загадочно и молчаливо залили новую модель на HuggingFace, даже не написав ничего ни в блоге, ни в README файле.Сегодня, наконец, вышел анонс с подробным описанием характеристик новой модели (а точнее, крутого обновления старой модели).

Давайте разбираться, что в этот раз нам подогнали китайские исследователи.В первую очередь, давайте посмотрим на результаты бенчей по математике и программированию:MMLU-Pro: вырос с 75.9 → 81.2 (+5.3)GPQA: вырос с 59.1 → 68.4 (+9.3)AIME: вырос с 39.6 → 59.4 (+19.8) (вау, SOTA, с сильным отрывом)LiveCodeBench: 39.2 → 49.2 (+10.0)В усреднённых результатах по всем тестам мы видим, что V3-0324 обгоняет текущие результаты Claude 3.5 (в целом, 3.5 - старая модель, ничего удивительного).

Читать на habr.com Все новости от habr.com

Huawei выпустила новые роутеры X1 и X1 Pro с Wi-Fi 7 и интеграцией с HarmonyOS

Появились слухи о новой модели G-Steel GST-B1000 от Casio

Компания Nubia представила новый игровой смартфон RedMagic 10 Air с чипом Snapdragon 8 Gen 3 и батареей 6000 мАч

Представлен новый смартфон Honor Power с огромным аккумулятором 8000 мАч

Huawei выпустила новые роутеры X1 и X1 Pro с Wi-Fi 7 и интеграцией с HarmonyOS

Появились слухи о новой модели G-Steel GST-B1000 от Casio

Компания Nubia представила новый игровой смартфон RedMagic 10 Air с чипом Snapdragon 8 Gen 3 и батареей 6000 мАч

Представлен новый смартфон Honor Power с огромным аккумулятором 8000 мАч

Новая сплит-система от Xiaomi может отслеживать нахождение людей в комнате

Акции Nvidia упали на фоне угрозы убытков в $5,5 млрд из-за новых ограничений США

Apple может увеличить цены на 17–18%, чтобы компенсировать расходы, вызванные новыми таможенными пошлинами в США

Новое оборудование Xiaomi станет полезным дополнением к любому ноутбуку

Lego открыла новую фабрику стоимостью $1 млрд во Вьетнаме на солнечных панелях

Apple не получит исключений от новых тарифов, Трамп обещает новые санкции для технологических компаний

Xiaomi 16 Pro может получить новый 50-мегапиксельный сенсор от Sony

Xiaomi представила новую смарткамеру Smart Camera 4 с функцией ночного видения и AI

Раскрыт дизайн и новые цвета OnePlus 13T перед анонсом

DeepSeek запатентовал технологию снижения нагрузки на сеть при сборе данных

Oppo Reno 14 Pro может получить новый дизайн камеры и кнопку, похожую на Action Button от Apple

НИУ ВШЭ запустил новые программы высшего образования в онлайн‑формате

OpenAI планирует выпустить новую открытую языковую модель AI в ближайшие месяцы

Китайские ученые запустили "искусственное солнце" и его температура установила новый рекорд

DeepSeek запускает усовершенствованную версию V3 AI через три месяца после первого релиза

Кай-Фу Ли переориентирует 01.AI на решения Deepseek, называя их экзистенциальной угрозой для OpenAI

DeepSeek запрещен на устройствах правительства США

Хэтчбек MG4 нового поколения отличился полностью иным дизайном и оказался крупнее предшественника

Ключевые инженеры DeepSeek сдали свои загранпаспорта, проект объявлен национальным достоянием Китая

Процессоры Intel Panther Lake задерживаются до 2026 года — новая дорожная карта

Reuters: Новая модель Tesla дебютирует в этом году и будет на 20% дешевле Model Y

Второй DeepSeek? Китайский стартап представил «полностью автономного ИИ-агента» Manus. Действительно ли он способен изменить индустрию?

VW ID.3 в Китае: новая батарея, низкая цена

Sony будет добавлять к снимкам цифровые подписи C2PA для верификации

Microsoft исправила звук запуска Windows Vista в Windows 11

Google Photos получил несколько улучшений

Спутниковая система Безоса теряет электроэнергию в космосе

Игровое подразделение Microsoft столкнется с дальнейшими сокращениями

Substack приносит новые обновления для прямых трансляций

Характеристики и цвета Moto G96 5G официально подтверждены

Honor выпускает «самый тонкий в мире» складной смартфон

One UI 8 раскрывает дизайн тройного телефона Samsung

Samsung Galaxy Z Fold 7 выглядит очень тонким

Исправление перегрева Pixel 6A выйдет через неделю

Кто построил Великую пирамиду: новые открытия ученых переворачивают представление о древнем Египте

Единственный продукт, который поможет похудеть, если есть его на завтрак

OneNote для Windows получило поддержку Dynamic DPI

Прорыв в области диабета: напечатанные на 3D-принтере островки поджелудочной железы могут заменить уколы инсулина

Каким "преимуществом" обладают люди, ложащиеся спать рано - ответ ученых

Идеи для осеннего отпуска: шесть топовых мест Европы

Грозит дисфункцией почек: кому нельзя пить более трех чашек кофе в день

Что нужно есть утром, чтобы похудеть, рассказали диетологи

Популярные средства для похудения могут вызвать серьезную болезнь

Tinder начал проверять профили новых пользователей в Калифорнии с помощью технологии распознавания лиц

Samsung Galaxy S26 Ultra получит аккумулятор прежней емкости, но с большей плотностью

ТОП-8 тревожных сигналов, что новый партнер вас просто использует, назвал психолог

Redmi Note 14 Pro и Pro+ теперь доступны в элегантном цвете Champagne Gold

Новый Alpine A290 Rallye готов раскидывать грязь и гравий за 60 тысяч евро

Шеф-дизайнер Mercedes заявил, что EQS вышел слишком рано и второго поколения не будет

Бензиновый Ford Mustang вновь обогнал электрический Mach-E по продажам в США

Еще одна жертва увольнений в Microsoft: Blizzard завершает контентную поддержку мобильной игры Warcraft Rumble

Представлено умное кольцо Pebble HALO с цифровым дисплеем

Сеанс со списанием: мошенники похищают деньги под предлогом онлайн-просмотра кино

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA