GPT-5.2 Pro назвали лучшим ИИ для сложной математики

habr.com

habr.com:

Год назад лучшие языковые модели решали около 2% задач бенчмарка FrontierMath. 30 декабря 2025 года GPT-5.2 Pro от OpenAI заняла первое место в самой сложной категории этого бенчмарка — Tier 4 — с результатом 29.2%.

Предыдущий лидер, Gemini 3 Pro Preview от Google, набрал 18.8%. На базовом наборе задач (Tier 1-3) модели OpenAI тоже лидируют: GPT-5.2 Thinking показывает 40.7% против 37.6% у Gemini 3 Pro.FrontierMath — бенчмарк от Epoch AI, состоящий из нескольких сотен оригинальных математических задач.

Читать на habr.com Все новости от habr.com

Чипы Huawei в нагрузку к H200. Китай назвал условие для закупок GPU Nvidia

Claude Code научили писать человечнее, использовав гайд Википедии для борьбы с ИИ-текстами

Бесплатно тестируем 55 видеомоделей: LMArena открыла Video Arena для всех

NVIDIA искала пиратские книги для обучения ИИ. Переписка попала в суд

Чипы Huawei в нагрузку к H200. Китай назвал условие для закупок GPU Nvidia

Claude Code научили писать человечнее, использовав гайд Википедии для борьбы с ИИ-текстами

Бесплатно тестируем 55 видеомоделей: LMArena открыла Video Arena для всех

NVIDIA искала пиратские книги для обучения ИИ. Переписка попала в суд

Выходцы из MIT создали рассуждающий ИИ для смартфонов — он занимает всего 720 МБ

Голоса в голове делают ответы ИИ лучше — исследование Google

GPT-5.2 Pro нашел новое решение задачи Эрдёша — хотя старое существовало с 1936 года

SoftBank вложил $1.4 млрд в «универсальный мозг для роботов» — оценка Skild AI достигла $14 млрд

GPT-5 отказался работать, Gemini назвал жалобу «необоснованной»: авторы Ubuntu протестировали ИИ на своей документации

Пока GPT-5.2 решает задачи Эрдёша, Gemini доказывает теоремы: новости ИИ-математики

Anthropic представила Cowork — ИИ-агента на базе Claude Code для широких задач

Gemini 3 Pro доделал эмулятор ZX Spectrum за один вечер. Проект был заброшен два года

Sony патентует ИИ для PlayStation, который возьмет геймпад и пройдёт сложный уровень за вас

OpenAI запустила ChatGPT Health — отдельный раздел для вопросов о здоровье

Gemini 3.0 Pro разгадал 500-летнюю тайну Нюрнбергской хроники всего за 2 рубля

ИИ для полицейских отчетов превратил офицера в лягушку — виноват Disney

Китай запустил национальный ИИ для ускорения науки. США отстают на 8 месяцев

GPT-4 обгоняет среднего человека в креативности, но проигрывает лучшим 10%

Глава Signal: AI-агенты с доступом к ОС — экзистенциальная угроза для шифрования

Российская Kandinsky 5.0 Pro названа лучшей открытой моделью для создания видео

Названа новая угроза для ИИ: GPU для обучения живут 1–3 года вместо заявленных шести

«Крестный отец ИИ» Янн ЛеКун запускает стартап ценой €3 млрд для создания моделей мира

OpenAI выпустила GPT-5.2-Codex — новый флагман для программирования

Вышла Gemini 3 Flash: модель уровня Gemini 3 Pro доступна бесплатно

ИИ AlphaFold 3 нашел мишень для вакцины от оспы обезьян, которую годами не замечали ученые

GPT-5.2 назвали самым цензурированным ИИ на рынке

GPT-5.2 и Gemini 3 Pro стали ИИ с самым высоким уровнем IQ

Саркофаги и ритуалы: как жили и верили римляне 2400 лет назад

Привычки, вредящие здоровью сердца, назвали кардиологи

Вся первая партия Samsung Galaxy Z TriFold в США распродана за 20 минут

IKEA выпустила новую Bluetooth-колонку в форме мыши

Caviar выпустила линейку кастомных iPhone 17 Pro Max в рамках коллекции Black Edition

Плюсы и минусы употребления картофеля, о которых мало кто знает

SpaceX хочет запустить миллион спутников для обслуживания ИИ

Hugging Face отказались от $500 млн Nvidia, чтобы остаться нейтральными для AMD и Intel

Xiaomi представила 34-дюймовый игровой монитор G34WQi 2026 с частотой 180 Гц за пределами Китая

JVC выпустит беспроводные наушники HA-A110T

Google выпустит наушники Pixel Buds 2a в двух новых цветах

Российский спутник-шпион распался на части на орбите Земли

Ваши артерии "страдают" от жира и холестерина - названы симптомы

Телескоп Уэбба приближается к Большому взрыву

Какие приборы обязательно выключать перед сном: предупреждение электриков

Моддер заменил кнопку включения ПК на монетоприёмник, который принимает только ¢25

Google запустила в Chrome ИИ-функцию автоматического просмотра

Простой способ замедлить старение обнаружили в одном продукте

Кто стоит за Moltbot (Clawdbot)

14 февраля для влюблённых во фронтенд: приглашаем на «Я Фронтенд»

Инструмент PS2Recomp позволит запускать игры для PlayStation 2 на современных ПК без эмуляции

Шесть признаков накопления токсинов в организме

М.Видео запустила продажу широкого ассортимента мебели на собственном маркетплейсе

С электронного адреса Microsoft стал поступать спам

Tesla впервые раскрыла количество подписчиков FSD

Пять "вечерних" привычек, которые незаметно повышают давление

Крупная утечка раскрывает подробности о Samsung Galaxy S26 Ultra

В Европе стартовали продажи ультратонкого магнитного пауэрбанка от Xiaomi

Пять продуктов, которые могут защитить легкие от болезней

В WhatsApp появится несколько платных подписок

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA