Вышел бенчмарк ARC-AGI-3: люди набирают 100%, GPT-5.4 — 0,26%

habr.com

habr.com:

ARC Prize Foundation опубликовала технический отчет о третьей версии бенчмарка ARC-AGI — теста на общий интеллект, созданного Франсуа Шолле, автором фреймворка Keras.

В отличие от предыдущих версий, где модели угадывали правила по статичным парам "вход — выход" на цветных сетках, ARC-AGI-3 — это 135 интерактивных пошаговых сред, по сути мини-игр на сетке 64×64.

Читать на habr.com Все новости от habr.com

Вышел Cursor 3.1: параллельные агенты в одном окне и новый голосовой ввод

ИИ открыл бутик в Сан-Франциско: нанял людей, взял кредит, нарисовал мерч

Милла Йовович выпустила революционный ИИ, который набирает 100% в бенчмарках

Вышел Cursor 3: внутри Composer 2, и можно запускать сколько угодно агентов

Вышел Cursor 3.1: параллельные агенты в одном окне и новый голосовой ввод

ИИ открыл бутик в Сан-Франциско: нанял людей, взял кредит, нарисовал мерч

Милла Йовович выпустила революционный ИИ, который набирает 100% в бенчмарках

Вышел Cursor 3: внутри Composer 2, и можно запускать сколько угодно агентов

Космический корабль Артемида II вышел на траекторию Луны

Manticore Search 25.0.0

На всех платформах вышел Darwin’s Paradox! — яркий экшен-платформер о приключениях милого Осьминога

На iOS и Android вышел условно-бесплатный шутер The Division: Resurgence — игра получает неплохие отзывы

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

Вышел Tails 7.6

Вышел продвинутый менеджер буфера обмена с опциями редактирования CopyQ 14.0

Вышел FreeCAD 1.1

Вышел Qt 6.11

Вышел AnyDesk 9.6.12 для Windows, AnyDesk 9.6.4 для MacOS и AnyDesk 8.0.1 для Linux/Raspberry Pi

Вышел открытый проект Bottles 63.0 — оболочки на основе Wine для запуска приложений Windows в Linux

Вышел проект CopySpeak — легковесное приложение для Windows, которое читает текст из буфера обмена вслух с помощью ИИ

Вышел открытый проект Cambalache 1.0 — инструмент для разработки GTK-интерфейсов

Вышел Wayland 1.25

Ваши селфи не будут прежними: для iPhone 17 Pro/Pro Max вышел уникальный чехол с задним AMOLED-дисплеем

Grok 4.20 вышел из беты: лидер по честности, но не по интеллекту

Вышел SuperTux 0.7

Вышел пиринговый видеохостинг PeerTube 8.1

Первый в мире планшет с 200 Гц OLED-экраном — им может стать Nubia Red Magic Gaming Tablet 5 Pro

AGIMA и «Инк.» выпустили исследование российского рынка онлайн-страхования

Вышел проект Winslop WinUI3 Release III для удаления ненужного системного мусора в Windows 10/11

Вышел XeniOS — эмулятор Xbox 360 для iPhone, iPad и Mac

ИИ пишет код, но не может его поддерживать: представлен первый CI-бенчмарк для ИИ-агентов

Почему у людей есть отпечатки пальцев — ответ не так очевиден

Инженеры создали чип, способный выдержать условия на Венере

Почему собака внезапно может стать агрессивной - ответ ветеринаров

Разработчики назвали дату выхода экшен-RPG «Былина»

МВФ призывает страны «быть начеку» из-за растущих рисков, связанных с ИИ

Инвесторы сомневаются в стратегии OpenAI на фоне роста Anthropic

Неочевидный сигнал крепких отношений, о котором говорят исследователи

Кости, пушки и униформа – что нашли на дне гавани спустя два столетия

Casio представила ограниченную серию Oceanus Manta с титановым корпусом и сапфировым безелем

OpenAI представила обновление Codex для разработчиков: какие функции стали доступны пользователям

Продукты, укрепляющие организм, назвали диетологи

Meta тестирует обновленный дизайн веб-версии Threads с поддержкой личных сообщений

Сколько шагов в день нужно, чтобы снизить риск ранней смерти

Anthropic обсуждает мораль и религию для Claude с христианскими лидерами

Claude Code теперь работает сам: Anthropic запустила Routines с триггерами по cron, API и GitHub

iPhone 18 Pro получит долгожданную переменную диафрагму

Amazon покупает Globalstar для усиления спутниковой связи и конкуренции со Starlink

Bambu Lab представила X2D — флагманский 3D-принтер с двумя экструдерами и гибридной подачей филамента

AI-специалисты массово возвращаются из США в Китай

ТОП-8 опасных побочных эффектов пищевых добавок и витаминов

Как ускорить работу смартфона - эксперты назвали простой способ

Во время съемки для Apple Vision Pro погибла парализованная путешественница

DJI Osmo Pocket 4: Дюймовый сенсор и 240 кадров в секунду для тех, кто ценит стабильность

Летом 2028 года: Activision и Paramount назвали дату премьеры фильма Call of Duty

Студия Watt показала первый геймплейный ролик игры Tsarevna

Ежедневные ритуалы по-настоящему счастливых и успешных людей

Когда Земля станет непригодной для жизни - ответ ученых

Продукты, которые не стоит есть на ужин, назвали врачи

Представлено умное кольцо Smalth Titanium Lava с эффектом застывшей лавы

Суд признал банкротом ООО «Майкрософт Рус»

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA