Фонд Arc Prize представил новый AGI-тест, который ставит в тупик большинство ИИ-моделей

habr.com

habr.com:

Фонд Arc Prize, некоммерческая организация, сооснованная видным исследователем ИИ Франсуа Шолле, объявил в блоге в понедельник о создании нового, сложного теста для измерения общего интеллекта ведущих моделей искусственного интеллекта.Пока что новый тест, получивший название ARC-AGI-2, оказался непосильным для большинства моделей.По данным таблицы лидеров Arc Prize, модели с акцентом на логическое мышление, такие как o1-pro от OpenAI и R1 от DeepSeek, набирают от 1% до 1,3% на ARC-AGI-2.

Мощные, но не специализированные на рассуждениях модели — включая GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Flash — показывают результат около 1%.Тесты ARC-AGI состоят из задач, напоминающих головоломки, где ИИ должен выявлять визуальные закономерности в массивах разноцветных квадратов и на их основе генерировать правильную сетку-ответ.

Читать на habr.com Все новости от habr.com

Lego представила новый конструктор в виде логотипа Star Wars

Компания Nubia представила новый игровой смартфон RedMagic 10 Air с чипом Snapdragon 8 Gen 3 и батареей 6000 мАч

Jeep представил новую версию Wagoneer — Overland Edition

Honor представила новую серию смартфонов Honor Power

Lego представила новый конструктор в виде логотипа Star Wars

Компания Nubia представила новый игровой смартфон RedMagic 10 Air с чипом Snapdragon 8 Gen 3 и батареей 6000 мАч

Jeep представил новую версию Wagoneer — Overland Edition

Honor представила новую серию смартфонов Honor Power

LG и will.i.am представили новую линейку Bluetooth-аудио продуктов

Audi представила новый A6 Sedan с рекордной аэродинамикой и мягким гибридом

ОМП представила новый браузер для ОС «Аврора» на базе Chromium

Xiaomi представила новую смарткамеру Smart Camera 4 с функцией ночного видения и AI

MTS AI представила нового ИИ‑ассистента для разработчиков

От $700 до $6500: Sony представила новую линейку телевизоров Bravia на 2025 год

Трейлер Days Gone Remastered представляет новый режим Horde Assault, который испытает ваши нервы и добавит драйва

Т1, «Аквариус» и «Группа Астра» представили новые ПАКи для корпоративных коммуникаций

Atonemo представила новый гаджет, превращающий обычные колонки в «умные»

«Росэлектроника» представила новые сверхнадежные миниатюрные датчики для медицинской и навигационной техники

Ayaneo представила портативную консоль Pocket ACE, которая отлично подойдет для эмуляции старых систем

TCL представила новый модульный саундбар Z100 с поддержкой Dolby Atmos

Hyundai представила новую информационно-развлекательную систему Pleos Connect, основанную на Android Automotive

Researcher и Analyst: новые инструменты Microsoft для глубокого анализа

Aston Martin и Curv Racing представили новый симулятор за $90 000 — с RTX 5090 и карбоновым монококом

«ИнфоТеКС» представила новый шлюз на базе российской платформы «АТБ-Электроника»

Новый тест AGI ставит в тупик большинство моделей ИИ

Яндекс представил новую линейку диффузионных моделей YandexART 2.5

Oppo представила новые смартфоны F29 и F29 Pro с акцентом на прочность и автономность

SK Hynix представила новое поколение 12-слойной скоростной памяти HBM4 и HBM3E

IVA Technologies представила новую версию IP-телефонии IVA CS

Популярные средства для похудения могут вызвать серьезную болезнь

Tinder начал проверять профили новых пользователей в Калифорнии с помощью технологии распознавания лиц

Samsung Galaxy S26 Ultra получит аккумулятор прежней емкости, но с большей плотностью

ТОП-8 тревожных сигналов, что новый партнер вас просто использует, назвал психолог

Redmi Note 14 Pro и Pro+ теперь доступны в элегантном цвете Champagne Gold

Новый Alpine A290 Rallye готов раскидывать грязь и гравий за 60 тысяч евро

Шеф-дизайнер Mercedes заявил, что EQS вышел слишком рано и второго поколения не будет

Бензиновый Ford Mustang вновь обогнал электрический Mach-E по продажам в США

Еще одна жертва увольнений в Microsoft: Blizzard завершает контентную поддержку мобильной игры Warcraft Rumble

Представлено умное кольцо Pebble HALO с цифровым дисплеем

Сеанс со списанием: мошенники похищают деньги под предлогом онлайн-просмотра кино

Вещество, останавливающее рост раковых клеток, ученые нашли в популярной специи

Три продукта, которые снижают риск развития деменции, обнаружили ученые

Honda и Sony потеряли $360 миллионов на автомобиле Afeela ещё до старта продаж

Techland возвращается к истокам: авторы Dying Light работают над новой частью Call of Juarez

Блогер показал жизнь, полностью лишенную Google

Instagram** теперь позволяет делиться песнями Spotify со звуком в Stories

Из-за ошибки тысячи жителей Норвегии стали «миллионерами» после «выигрыша» в лотерее

В Сочи сделали парковки для электросамокатов вне тротуара

Завтра Земля будет дальше всего от Солнца: что это значит для нас

Раньше не встречались: ученые открыли три новых минерала

EGS запустил раздачу музыкальной адвенчуры Figment и roguelike-игры Backpack Hero

Motorola выпустила бюджетный смартфон Moto G100 Pro с неплохими характеристиками за разумные деньги

Релиз Qmmp 2.2.7 — открытого мультимедийного проигрывателя на базе Qt для Windows и Linux

В четыре раза точнее врача. В Microsoft создали «консилиум» из ИИ для постановки диагноза

Релиз Cryptsetup 2.8 — набора утилит для настройки шифрования дисковых разделов в Linux

Вышел digiKam 8.7.0

Представлен переносной игровой SSD-накопитель Acer Predator GP30 RGB

Упражнение, которое продлит жизнь на 7 лет, назвала известный тренер

Android 16 появится на смартфонах Nothing не раньше осени: компания не спешит с выпуском новой версии своей оболочки

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA