Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

habr.com

habr.com:

OpenAI представила GPT-5.2 — свою новую флагманскую модель, которая доступна в API и раскатывается в ChatGPT. А организация ARC Prize уже опубликовала результаты своих бенчмарков ARC-AGI-1 и ARC-AGI-2, которые считаются сложным тестом на абстрактное мышление и нередко называются "экзаменом на AGI".

Модель заняла первое место в обоих бенчмарках, но остановимся на результатах ARC-AGI-2 — эта версия была выпущена недавно и считается, что ее задачи еще не "попали" в обучающие дата-сеты для ИИ.Итак, GPT-5.2 Pro выполняет 54,2% задач против 54% у предыдущего рекордсмена.

Читать на habr.com Все новости от habr.com

Блэкаут в Сан-Франциско парализовал роботакси Waymo — эксперты требуют новых правил

Пока Запад спорит об AGI, Китай регулирует ИИ-подружек

Автор «теста на AGI» объяснил истинную цель своего бенчмарка

ИИ создал 50 новых миллиардеров в 2025 году — кто они и на чем заработали

Блэкаут в Сан-Франциско парализовал роботакси Waymo — эксперты требуют новых правил

Пока Запад спорит об AGI, Китай регулирует ИИ-подружек

Автор «теста на AGI» объяснил истинную цель своего бенчмарка

Anthropic и OpenAI удвоили лимиты до Нового года. Пользователи Claude не заметили разницы

«Общий интеллект — полная чушь»: Янн ЛеКун и Демис Хассабис поспорили, что называть AGI

Доработанная GPT-5.2 обошла человека в «тесте на AGI»

Глава Google DeepMind: У человечества осталось 10 лет на адаптацию к новому миру

Атеистический Китай сделал самый христианский ИИ: Qwen3 победил в религиозном бенчмарке

Claude Opus 4.5 побил рекорд автономности: справляется с 5-часовыми задачами, но есть нюансы

Сэм Альтман пообещал новую GPT в первом квартале 2026 года. Google уже готовит ответ

Названа новая угроза для ИИ: GPU для обучения живут 1–3 года вместо заявленных шести

Сэм Альтман опять разочаровался в термине AGI. Новая цель — суперинтеллект

OpenAI выпустила GPT-5.2-Codex — новый флагман для программирования

Андрей Карпати с помощью GPT-5.1 проверил IT-прогнозы 10-летней давности

Google выпустила новый голосовой ИИ на Gemini: в тестах он помог оформить 14 000 ипотечных кредитов

Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи

OpenAI: каждая новая ИИ-модель может стать кибероружием

Японский стартап изобрел AGI — и заодно собственное определение AGI

Сэм Альтман отложил гонку за AGI. ChatGPT важнее

OpenAI тестирует новую генерацию изображений для ChatGPT. Примеры работы и где попробовать

GPT-5 подсказал новую идею в квантовой теории поля — физик довел ее до публикации в престижном издании

GPT-5.2 на подходе? OpenAI начала тестировать новую модель на Design Arena

Компания OpenAGI выпустила новый ИИ Lux, который автономно управляет компьютером

ChatGPT может получить новую модель на следующей неделе — она «будет лучше Gemini 3 Pro»

После GPT-4o OpenAI не выпустила ни одной по-настоящему новой модели ИИ — SemiAnalysis

ChatGPT получил новый голосовой режим

Claude Opus 4.5 стал лидером в сложнейшем тесте ИИ

OpenAI запускает ChatGPT Health: отдельный раздел для запросов о здоровье

Whisper Aero представила ультратихий воздуходув с мощностью 880 CFM и LED-подсветкой

Bluetti представила Charger 2 с поддержкой одновременного питания от авто и солнца

Неочевидный вред пива назвали врачи

Названы продукты, способные нанести вред мозгу

Casio выпустила часы G-Shock POTR DW-5600 совместно с брендом Porter

HP выпустила обновленную линейку игровых ноутбуков

Hyundai начнет использовать человекоподобных роботов на автозаводах

Mitsubishi и AT&T договорились о внедрении 5G в автомобилях

Объявлены финалисты премии 2026 World Car Awards

Чи здатний штучний інтелект до справжньої творчості: алгоритм, або натхнення

Dell представила мощные ноутбуки XPS 14 и XPS 16

Mercedes сохранит A-Class, но производство модели перенесут из Германии в Венгрию

Томас Ингенлат возвращается на пост главного дизайнера Volvo

Как пары незаметно разрушают свои отношения, рассказал психолог

Почему во рту появляется привкус металла и что делать

Будущее без экранов: OpenAI готовит первое аудио-устройство

Blizzard готовит мега-анонс: уже в этом году могут представить долгожданный шутер по культовой франшизе StarCraft

Motorola официально представила смартфон-книжку Razr Fold

Ученые напечатали крошечные «световые клетки» для хранения информации

Новый вирус угрожает ТВ-приставкам и телевизорам на Android

Вышел открытый проект оконного менеджера IceWM 4.0.0

Lenovo представила профессиональный монитор Yoga Pro 27UD‑10 с 4K‑камерой и продвинутой цветокоррекцией

Употребление алкоголя особенно опасно для людей с лишним весом - врачи

Поможет найти потерянное: Motorola представила трекер Moto Tag 2 с автономностью до 600 дней и глубокой интеграцией в экосистему Android Find Hub

Вышла версия Glow 26.1 — инструмента для системного анализа аппаратных и программных возможностей ПК на Windows 10/11

Производительность станет еще выше: Lenovo подтвердила выпуск новой версии портативной консоли Legion Go 2 с предустановленной SteamOS

Dell анонсировала UltraSharp 32 4K QD‑OLED — свой первый профессиональный монитор с антибликовым покрытием нового поколения и встроенным колориметром

Razer выпустила игровое кресло Iskur V2 NewGen с крутой системой поддержки поясницы HyperFlex и с использованием новых материалов Razer EPU

HP представила масштабное обновление линейки ПК

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA