Бенчмарк ARC перестаёт быть барьером: современные подходы оптимизации рушат его значимость

habr.com

habr.com:

Бенчмарк ARC (Abstraction and Reasoning Corpus), долгое время считавшийся одной из самых сложных проверок абстрактного мышления для ИИ, оказался ещё одной «жертвой» оптимизации и инженерных ухищрений в индустрии ИИ.

По данным аналитиков и свежим результатам стартапа Poetiq, современные системы на базе больших моделей, включая GPT‑5.2 X‑High, показали до 75 % точности на ARC‑AGI‑2, что выше средней оценки человека на этих задачах.

Читать на habr.com Все новости от habr.com

Claude Opus 4.5 набрал 92% на медицинском бенчмарке Стэнфорда — и получил доступ к данным пациентов

Из-за внедрения ИИ сотрудники начали чаще уставать и быть менее продуктивными

Продажи Extraction-шутера ARC Raiders приблизились к 12,5 миллионам копий — небольшой коллектив Embark утер нос Battlefield 6 и Black Ops 7

Почему современные пары расстаются чаще всего - ТОП-4 причины

Claude Opus 4.5 набрал 92% на медицинском бенчмарке Стэнфорда — и получил доступ к данным пациентов

Из-за внедрения ИИ сотрудники начали чаще уставать и быть менее продуктивными

Продажи Extraction-шутера ARC Raiders приблизились к 12,5 миллионам копий — небольшой коллектив Embark утер нос Battlefield 6 и Black Ops 7

Почему современные пары расстаются чаще всего - ТОП-4 причины

Игрок так громко звал на помощь в ARC Raiders, что сосед‑пожарный попытался выбить ему дверь ради спасения

ТОП-10 вещей, которых не должно быть на современной кухне

Grok 4 лидирует в бенчмарке по торговле акциями: +5,7% за пять недель

Мини-PC может быть геймерским: Asus представила ROG GR70 с флагманским процессором Ryzen 9 и GeForce RTX 5070 Laptop

Продукты с антираковым эффектом, которые должны быть в вашем рационе

В Огайо хотят запретить ИИ быть сознательным. WSJ опубликовал критику

Автор «теста на AGI» объяснил истинную цель своего бенчмарка

Battlefield 6, ARC Raiders и Hollow Knight: Silksong вошли в топ самых успешных новинок 2025 года в Steam

Рекрутеры: удалённая работа официально перестала быть популярной в компаниях

Атеистический Китай сделал самый христианский ИИ: Qwen3 победил в религиозном бенчмарке

PackEat в опенсорсе: датасет с изображениями фруктов и овощей — а также бенчмарки к нему

Xiaomi выпустила MiMo-V2-Flash 309B, модель достигла абсолютного верха в агентном бенчмарке

Сэм Альтман признался, что его абсолютно не прельщает идея быть главой публичной компании

Какие витамины могут быть опасны при высоком давлении

Почему ваш Smart TV тормозит: причина может быть в настройках Wi‑Fi

Чем может быть опасно регулярное употребление черного чая

FrontierScience: OpenAI выпустила бенчмарк PhD-сложности для проверки научного мышления ИИ

Kingdom Come: Deliverance II стала Лучшей игрой 2025 года по версии PC Gamer — призы получили и Dispatch, Hollow Knight: Silksong и ARC Raiders

Егор Буркин: химия точных решений в эпоху нестабильности | ФОКУС ВНИМАНИЯ

Google запустил своего самого продвинутого ИИ-агента в день выхода GPT-5.2 от OpenAI

Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

Starcloud впервые обучил ИИ в космосе и готовит орбитальные дата центры

Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи

В Европе стартовали продажи умного холодильника Xiaomi Mijia Refrigerator Cross Door 502L с тремя зонами охлаждения и поддержкой голосовых помощников

Resident Evil Requiem запускается на PlayStation 5 Pro в 4K при 60 FPS — Capcom обещает нереальную производительность

Microsoft внедряет Claude Code в свои команды — при том, что владеет GitHub Copilot

Эксперты зафиксировали рост DDoS-атак в России до 100% и смену тактики киберпреступников

Google узаконила ИИ-кликбейт

Apple представила ремешок Black Unity Braided Solo Loop для Apple Watch

250 км к любви: кот вернулся домой спустя пять месяцев (ФОТО)

Лучший вариант обеда: что нужно есть, чтобы жить дольше

«Код Дурова»: РКН прикрыл возможности обхода ограничений при отключении мобильного интернета через VPN-сервисы

Банки обяжут отчитываться о снятии наличных без согласия клиента

Такой смартфон невозможно купить: 3800 уникальных Galaxy Z Flip7 получат участники Олимпийских игр 2026

НТЦ ИТ «Роса» запустила единый портал с технической документацией по своим решениям

T2 списывает по 15 тыс. рублей за «красивый номер» при смене оператора связи, но это есть в договоре, а номер обычный

Bitget запустила чемпионат Trading Club с призовым фондом 27 000 BGB

СМИ: власти США намерены использовать ИИ для разработки регуляторных норм

Главную опасность головных болей назвали врачи

ТОП продуктов, которые успокоят желудок при изжоге

«Google Фото» научились превращать фотографии пользователей в мемы с помощью ИИ

Почта Mail заблокировала 29,6 млрд спам-писем за 2025 год

Еврокомиссия запустила расследование деятельности X после скандала с Grok

Everything привлекла почти $7 млн на создание «универсальной биржи» в Telegram

Doom установили на единственные наушники с открытым кодом — энтузиаст разогнал их процессор

Какие приборы тянут электроэнергию, даже когда выключены: их все забывают

Следующий State of Play состоится в середине февраля — сразу два инсайдера рассказали о подготовке нового шоу

Samsung почти вдвое поднимает стоимость флэш-памяти NAND

В Госдуме РФ опровергли использование ChatGPT при написании законопроекта

Bloomberg: владельцы Leica ведут переговоры о продаже контрольного пакета акций стоимостью 1 миллиард евро

Вышло обновление StaxRip 2.50.6 — открытой утилиты для Windows для кодирования видео/аудио с поддержкой HEVC, AVC и AV1

GitHub открыла доступ к агентным возможностям Copilot через SDK

«Языковые модели не приведут к AGI»: лауреат Тьюринга поспорил с Амодеи и Хассабисом в Давосе

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA