DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

habr.com:

Китайская лаборатория искусственного интеллекта DeepSeek выпустила открытую версию DeepSeek-R1, своей так называемой модели рассуждений, которая, по её утверждению, работает так же хорошо, как o1 от OpenAI в определённых тестах AI.R1 доступен на платформе для разработки AI Hugging Face по лицензии MIT, что означает, что его можно использовать в коммерческих целях без ограничений. По данным DeepSeek, R1 превосходит o1 в тестах AIME, MATH-500 и SWE-bench Verified.

AIME использует другие модели для оценки производительности модели, а MATH-500 представляет собой набор текстовых задач. SWE-bench Verified, в свою очередь, ориентирован на задачи программирования.Ознакомится с моделью и попробовать в действии можно на нашем сайте.Будучи моделью рассуждений, R1 эффективно проверяет факты, что помогает ей избежать некоторых ошибок, которые обычно приводят к сбоям в работе моделей.

Читать на habr.com Все новости от habr.com

В NowSecure выяснили, что приложение DeepSeek для iOS не защищает данные пользователей

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

Новые изображения Oppo Find N5 показали, что его основной экран не имеет видимой складки

Эксперты Feroot Security выяснили, что после регистрации DeepSeek передаёт данные пользователей в China Mobile

В NowSecure выяснили, что приложение DeepSeek для iOS не защищает данные пользователей

Исследователи создали открытого конкурента модели рассуждений OpenAI o1 менее чем за $50

Новые изображения Oppo Find N5 показали, что его основной экран не имеет видимой складки

Эксперты Feroot Security выяснили, что после регистрации DeepSeek передаёт данные пользователей в China Mobile

Nvidia утверждает, что её новые графические процессоры — самые быстрые для DeepSeek AI

Цензура в DeepSeek работает при локальном запуске модели

AI-модели, такие как Deepseek-R1 и OpenAI o1, страдают от «недомыслия»: как это можно исправить