Доработанная GPT-5.2 обошла человека в «тесте на AGI»

habr.com

habr.com:

Стартап Poetiq из шести выходцев Google DeepMind добился 75% на бенчмарке ARC-AGI-2 — тесте на "гибкий интеллект" от Франсуа Шолле и команды ARC Prize.

Средний человек на том же тесте набирает 60%. Результат получен на GPT-5.2 X-High при стоимости менее $8 за задачу, это примерно на 15 процентных пунктов выше предыдущего лидера — обычной GPT-5.2 X-High.

Читать на habr.com Все новости от habr.com

DeepSeek V4 обещает превзойти Claude и GPT в кодинге — релиз ожидается в феврале

Илон Маск: AGI появится в 2026-м, а к 2030-му ИИ обгонит все человечество

40 млн человек ежедневно спрашивают ChatGPT о здоровье. OpenAI хочет, чтобы FDA это узаконила

GPT-5.2 и ИИ Aristotle решили 50-летнюю математическую задачу Эрдёша

DeepSeek V4 обещает превзойти Claude и GPT в кодинге — релиз ожидается в феврале

Илон Маск: AGI появится в 2026-м, а к 2030-му ИИ обгонит все человечество

GPT-5.2 и ИИ Aristotle решили 50-летнюю математическую задачу Эрдёша

Эксперты Стэнфорда: AGI в 2026-м не будет, а ИИ-пузырь не лопнет — он медленно сдуется

GPT-5.2 Pro назвали лучшим ИИ для сложной математики

GPT-4 обгоняет среднего человека в креативности, но проигрывает лучшим 10%

«Стрессовая работа»: Сэм Альтман ищет того, кто скажет GPT «стоп»

Создатели GPT-5-Codex-Max рассказали о будущем разработки ПО

Пока Запад спорит об AGI, Китай регулирует ИИ-подружек

Автор «теста на AGI» объяснил истинную цель своего бенчмарка

«Общий интеллект — полная чушь»: Янн ЛеКун и Демис Хассабис поспорили, что называть AGI

AI пишет код в 1,7 раза хуже человека, но это можно исправить — CodeRabbit

Сможем ли мы контролировать GPT-7? OpenAI измерили «наблюдаемость» цепочки рассуждений ИИ

Сэм Альтман опять разочаровался в термине AGI. Новая цель — суперинтеллект

OpenAI выпустила GPT-5.2-Codex — новый флагман для программирования

Андрей Карпати с помощью GPT-5.1 проверил IT-прогнозы 10-летней давности

Claude Code, GPT-5.2 и DeepSeek V3.2 возглавили рейтинг ИИ-программистов — в разных категориях

Глава Google DeepMind рассказал, как собирается строить AGI

Google выпустила новый голосовой ИИ на Gemini: в тестах он помог оформить 14 000 ипотечных кредитов

Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

Человек года — не человек. Архитекторы ИИ получили престижную награду TIME

Японский стартап изобрел AGI — и заодно собственное определение AGI

Сэм Альтман отложил гонку за AGI. ChatGPT важнее

OpenAI будет выдавать сертификаты «готовности к работе с ИИ». План — 10 млн человек за 5 лет

Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2

Известный ML-исследователь разобрал DeepSeek V3.2 и рассказал, как открытая модель догнала GPT-5

Google выпустила режим Gemini 3 Deep Think — почти втрое обходит GPT-5.1 на тестах абстрактного мышления

Microsoft внедрит больше опций ИИ в проводник файлов в Windows 11

Вы едите слишком много сахара - тревожные признаки назвали эксперты

Представлен выпуск открытого файлового менеджера Double Commander 1.2.0 beta Pre-release

Что меняется в вашем теле уже после 30 минут ходьбы - исследование

Лекарства, которые опасно сочетать с витаминами, назвали врачи

Неожиданный постер раскрыл дату релиза Forza Horizon 6

Вышел QuickLook 4.4 — открытый проект, который переносит функцию быстрого просмотра Quick Look из macOS в Windows 10/11

Зафиксирован первый случай повреждения экрана смартфона Samsung Galaxy Z TriFold

16% населения Земли уже пользуется ИИ. DeepSeek выбирают в развивающихся странах

«Вселенская машина времени»: патент на управление всем сущим

Франция вынесла предупреждения 90 криптокомпаниям без лицензии MiCA

CEO MANTRA объявил о реструктуризации и сокращении штата

Представлены умные коллекционные фигурки: работают с помощью ИИ

Endolift + нитевой лифтинг: как в эстетической медицине работает принцип «железо + софт»

Линус Торвальдс признался, что не умеет писать на Python. И использовал ИИ

Не только для флешки: для чего нужен USB-порт на телевизоре

Объем торгов токеном BERA вырос более чем на 2000% за сутки на фоне обновленной стратегии сети на 2026 год

«Рынок внимания» Noise получил более $7 млн от Paradigm и других инвесторов

Полезный вид хлеба, который "запускает" работу кишечника

Компания Lightricks открыла исходный код модели видеоанализа на основе ИИ LTX-2

ТОП-5 критических симптомов боли, которые нельзя игнорировать

Эксперт: не стоит ожидать повторения криптосценария 2020-2021 годов

В Bitwise порекомендовали включить в портфель одновременно золото и биткоин

«Купили время». Онлайн-университет Choice31 из группы Fractal объединяется с образовательной платформой IAMPM. Зачем и какая сумма

Илон Маск пообещал открыть доступ к исходному коду нового алгоритма X через семь дней

ИИ-ускорители уперлись в предел скорости HBM

В Великобритании набирают популярность «рабочие каникулы» или по‑другому «воркейшны»

Стоимость акций Nintendo упала на 33% за несколько месяцев — инвесторы обеспокоены замедлением продаж Switch 2

Garmin выпустила смарт-часы Quatix 8 Pro для любителей морских путешествий

Подросток из Калифорнии сделал ChatGPT «наркосоветником» и умер от передозировки

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA