Выпущенная модель OpenAI o3 значительно слабее предварительной версии в тестах на рассуждение

habr.com

habr.com:

Недавний анализ, проведенный фондом Arc Prize Foundation показал, что модель o3 от OpenAI демонстрирует значительно более слабые результаты на стандартизированных тестах рассуждений, чем ранее протестированная предварительная версия o3.

ARC Prize Foundation, некоммерческая группа, занимающаяся оценкой AI, использует открытые бенчмарки, такие как ARC-AGI, чтобы подчеркнуть разрыв между человеческим мышлением и текущими системами искусственного интеллекта.

Читать на habr.com Все новости от habr.com

Stability AI выпускает модель ИИ для создания стереотреков на смартфонах

Meta откладывает запуск Llama 4 Behemoth: модель все еще не готова

OpenAI запустила обновленную модель чат-бота GPT-4.1 для всех пользователей

Microsoft и OpenAI могут пересмотреть условия своего партнерства

Stability AI выпускает модель ИИ для создания стереотреков на смартфонах

Meta откладывает запуск Llama 4 Behemoth: модель все еще не готова

Microsoft и OpenAI могут пересмотреть условия своего партнерства

OpenAI объяснила, как выбрать подходящую модель ChatGPT

Новая небольшая модель искусственного интеллекта Ai2 превосходит аналогичные по размеру модели от Google и Meta*

Microsoft бросает вызов OpenAI с новыми моделями AI Phi-4 с открытым исходным кодом

Xiaomi выпустила MiMo — открытую языковую модель с функцией рассуждения

Предстоящая открытая модель OpenAI получит доступ к облачным возможностям

OpenAI выпускает «облегченную» версию своего инструмента для глубоких исследований ChatGPT

Реструктуризация OpenAI вызывает опасения у экспертов по поводу контроля и безопасности AGI

OpenAI добавляет модель изображения ChatGPT «GPT-Image-1» в API для разработчиков

OpenAI планирует выпустить открытую модель AI этим летом, чтобы конкурировать с Meta* и DeepSeek

«Сбер» разработал и опубликовал первую в России модель для кибербезопасности искусственного интеллекта

BitNet- новая энергоэффективная языковая модель Microsoft

Оценки безопасности показывают, что o3 OpenAI, вероятно, самая рискованная модель компании на сегодняшний день

Первая модель Audi, созданная исключительно для Китая, дебютировала на публике — и она очень мощная

Seedream 3.0: новая модель преобразования текста в изображение от ByteDance

Weekly: обвал токена OM, новые модели OpenAI, эксперимент Base и игра Трампа

Исследователи Microsoft заявили, что разработали сверхэффективную модель ИИ, которая может работать на CPU

Cohere выпускает Embed 4: новая модель для работы с большими объёмами данных

Новые модели OpenAI o3 и o4-mini «думают образами»

Вышла OpenAI GPT 4.1 — новая главная модель для программирования

OpenAI планирует постепенно исключить GPT-4.5, свою самую большую модель искусственного интеллекта, из своего API

Самая быстрая и самая дешевая. OpenAI выпустила новую флагманскую модель ИИ GPT-4.1

OpenAI скоро выведет из эксплуатации GPT-4

Исследование Microsoft показывает, что модели AI по-прежнему испытывают трудности с отладкой программного обеспечения

Samsung представила предварительную версию One UI 7 для Galaxy Tab S9 FE: первое впечатление от пользователя

OneNote для Windows получило поддержку Dynamic DPI

Прорыв в области диабета: напечатанные на 3D-принтере островки поджелудочной железы могут заменить уколы инсулина

Каким "преимуществом" обладают люди, ложащиеся спать рано - ответ ученых

Идеи для осеннего отпуска: шесть топовых мест Европы

Грозит дисфункцией почек: кому нельзя пить более трех чашек кофе в день

Что нужно есть утром, чтобы похудеть, рассказали диетологи

Популярные средства для похудения могут вызвать серьезную болезнь

Tinder начал проверять профили новых пользователей в Калифорнии с помощью технологии распознавания лиц

Samsung Galaxy S26 Ultra получит аккумулятор прежней емкости, но с большей плотностью

ТОП-8 тревожных сигналов, что новый партнер вас просто использует, назвал психолог

Новый Alpine A290 Rallye готов раскидывать грязь и гравий за 60 тысяч евро

Еще одна жертва увольнений в Microsoft: Blizzard завершает контентную поддержку мобильной игры Warcraft Rumble

Бензиновый Ford Mustang вновь обогнал электрический Mach-E по продажам в США

Шеф-дизайнер Mercedes заявил, что EQS вышел слишком рано и второго поколения не будет

Redmi Note 14 Pro и Pro+ теперь доступны в элегантном цвете Champagne Gold

Представлено умное кольцо Pebble HALO с цифровым дисплеем

Сеанс со списанием: мошенники похищают деньги под предлогом онлайн-просмотра кино

Вещество, останавливающее рост раковых клеток, ученые нашли в популярной специи

Три продукта, которые снижают риск развития деменции, обнаружили ученые

Honda и Sony потеряли $360 миллионов на автомобиле Afeela ещё до старта продаж

Techland возвращается к истокам: авторы Dying Light работают над новой частью Call of Juarez

Блогер показал жизнь, полностью лишенную Google

Из-за ошибки тысячи жителей Норвегии стали «миллионерами» после «выигрыша» в лотерее

Instagram** теперь позволяет делиться песнями Spotify со звуком в Stories

В Сочи сделали парковки для электросамокатов вне тротуара

Завтра Земля будет дальше всего от Солнца: что это значит для нас

Раньше не встречались: ученые открыли три новых минерала

EGS запустил раздачу музыкальной адвенчуры Figment и roguelike-игры Backpack Hero

Motorola выпустила бюджетный смартфон Moto G100 Pro с неплохими характеристиками за разумные деньги

Релиз Qmmp 2.2.7 — открытого мультимедийного проигрывателя на базе Qt для Windows и Linux

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA