GPT-5-Pro стала новым лидером в сложнейшем ИИ-бенчмарке

habr.com

habr.com:

ARC Prize сообщает, что GPT-5-Pro смогла показать результат в 18,3% в бенчмарке ARC-AGI-2, который считается одним из самых сложных для ИИ.

Предыдущим лидером был Grok 4 с результатом 15,9%, а вот до «человеческого» уровня модели далеко — это минимум 85%.Бенчмарк ARC-AGI-2 — это «Корпус абстракции и рассуждения (Abstraction and Reasoning Corpus)».

Читать на habr.com Все новости от habr.com

Бывший сотрудник OpenAI раскритиковал идею добавления эротики в ChatGPT

Сотрудник OpenAI извинился за то, что приписал GPT-5 чужие научные открытия

GPT-5 Pro за 30 минут выполнила расчет скрытой симметрии Керра — у физика ушли дни

DeepSeek вышел на первое место в бенчмарке по торговле криптовалютой

Бывший сотрудник OpenAI раскритиковал идею добавления эротики в ChatGPT

Сотрудник OpenAI извинился за то, что приписал GPT-5 чужие научные открытия

GPT-5 Pro за 30 минут выполнила расчет скрытой симметрии Керра — у физика ушли дни

Google Gemini 3.0 Pro создала клоны популярных игр

Инвестор раскрыл дату выхода GPT-6

GPT-5 Pro нашла контрпример к давней математической гипотезе

Прототип Google Gemini 3.0 Pro создал «копии» Windows и MacOS

GPT-5-Pro необычным способом «закрыла» нерешенную математическую задачу

GPT-5 и Gemini 2.5 Pro «взяли золото» Международной олимпиады по астрономии и астрофизике

GPT-OSS теперь можно запустить на топовых Android-смартфонах

GPT-5 Pro стала новым лидером в решении сложнейших математических задач

ChatGPT установил рекорд посещаемости и стал единственным растущим веб-сайтом в топ-10

Сэм Альтман рассказал, как будут оценивать GPT-6

В сети появились первые примеры работы Gemini 3.0 Pro

OpenAI выпустила Sora 2 Pro

Новый ИИ Claude Sonnet 4.5 может программировать до 30 часов подряд

Представлен Claude Sonnet 4.5: новый лидер в задачах программирования

В ChatGPT добавили функцию родительского контроля

Создатели ChatGPT выпустили сборник из 300+ промптов для разных сфер

GPT-5 частично прошла “тест Гёделя” на доказательство новых математических гипотез

В OpenAI признали, что подменяют ответы одной модели ChatGPT на другую

GPT-5 победил в необычном бенчмарке Among AIs

Запущена ChatGPT Pulse

OpenAI тестирует нового ИИ-агента для ChatGPT

ИИ для программирования GPT-5-Codex вышел в API

Google выпустила нового голосового помощника на базе Gemini 2.5 Flash

В ChatGPT появятся функции за дополнительную плату

Прорыв в технологии солнечных башен: до 99,5% поглощения солнечного света

В какое время суток нельзя употреблять шоколад, рассказали врачи

AMD переведёт видеокарты серий RX 5000 и 6000 «в режим обслуживания»

Состоялся выпуск платформы совместной разработки Gitea 1.25

Представлен первый в мире интеллектуальный бытовой робот Dobot Rover X1

В Белом доме прокомментировали помилование Чанпэна Чжао

XPeng показала робота-человека Iron. Причем как «мужчину», так и «женщину»

«Пионеры направления». Крупный производитель FPV-дронов TAF Industries Александра Яковенко купил долю в нескольких DefenceTech-компаниях. Сколько он потратил на сделки

Вышел AnyDesk 9.6.4 для Windows и 7.1.1 для Linux

С 1 ноября 2025 года в РФ вступил в силу закон: на одного гражданина может быть зарегистрировано не более 20 СИМ‑карт

61 мегапиксель в кармане: новая полнокадровая Sony RX1R III уже в Украине

Зона станет еще хардкорнее: в STALKER 2 скоро появится уровень сложности “Мастер”

Тысяча сбитых целей: команда "Дикі Шершні" опубликовала новое видео про дрон-перехватчик STING

Релиз Rust 1.91.0

Канада раскрыла планы по регулированию стейблкоинов

Учёные определили, какая мусорная еда вреднее всего для нашего мозга

Cline v3.35: нативные вызовы инструментов, обновлённое авторазрешение и бесплатный MiniMax M2

OpenAI o3, Claude Sonnet 4.5 и Grok 4 оказались лучшими игроками в покер

Физики обнаружили редкие чёрные дыры «второго поколения», вновь подтвердив правоту Эйнштейна

MiniMax представили генератор музыки нового поколения

«Это не первый мой пузырь»: биржевой аналитик призвал продавать акции Nvidia

«Триколор» заявил о работе над ОС для ТВ и перезапуске своего видеосервиса

Глава РКН рассказал, что вместо запроса согласий на обработку персональных данных надо ввести отраслевые стандарты

Kimi представили новую модель — Kimi-Linear-48B-A3B-Base

Бывший министр финансов Британии присоединился к запуску биткоин-компании

Инсайдер о Redmi Turbo 5 Pro: аккумулятор на 9000 мАч, зарядка на 100 Вт и полная водозащита

Серия Samsung Galaxy S26 может оказаться дороже предшественников

Зафиксирована вспышка черной дыры, которая сияет как 10 триллионов Солнц

Как ежедневное употребление сыра влияет на организм и самочувствие

Учёные нашли способ выращивать алмазы без нагрева и давления

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA