Claude Opus 4.5 стал лидером в сложнейшем тесте ИИ

habr.com

habr.com:

Практически сразу после выхода Claude Opus 4.5, организация ARC Prize опубликовала результаты модели в своих бенчмарках ARC-AGI-1 и ARC-AGI-2.

В ARC-AGI1 модель достигает 80% при цене в $1,47 за выполнение задания, а в ARC-AGI-2 — 37,64% при цене в $2,40.ARC-AGI — серия тестов на абстрактное мышление, определяющих умение модели извлекать знание и переносить его на похожие типы задач.

Читать на habr.com Все новости от habr.com

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

Google выпустила новый голосовой ИИ на Gemini: в тестах он помог оформить 14 000 ипотечных кредитов

Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

Google выпустила новый голосовой ИИ на Gemini: в тестах он помог оформить 14 000 ипотечных кредитов

Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

Claude Opus 4.5 стал лучшим в бенчмарке на реальные рабочие задачи

Mistral выпустила две модели для кодинга: одна соперничает с Claude Sonnet, вторая работает на домашнем GPU

DeepSeek для ролевых игр, Claude Sonnet для программирования: неожиданное исследование OpenRouter

Стартап из шести выходцев DeepMind обошел Gemini 3 на главном бенчмарке абстрактного мышления ARC-AGI-2

DeepSeek — единственная в Китае компания, накопившая GPU. Остальные ищут ресурсы за рубежом

Claude Opus 4.5 назвали лучшим ИИ для веб-разработки

Вышла Claude Opus 4.5

Anthropic представили Claude Opus 4.5: лучшую в мире модель для кодинга и агентов

Вышел Claude Opus 4.5: лучший ИИ для кода втрое дешевле прежнего Opus

Gemini 3 Pro стал первым ИИ, достигшим уровня IQ 130

Claude Opus 4.5: на Reddit появились намёки на скорый релиз

Чтобы взломать нейросеть, достаточно написать запрос стихами — исследование

Андрей Карпати собрал «совет ИИ»: GPT-5.1, Gemini 3 Pro, Claude и Grok спорят за лучший ответ

Anthropic представила Claude Opus 4.5 — «самый мощный ИИ» для кодирования и агентных систем

ChatGPT, Grok и Claude оправдали подростка в учебном суде. Реальный судья вынес обвинительный приговор

OpenAI выпустила GPT-5.1-Codex-Max — новый лидер в программировании

Gemini 3 Pro стала первой в дизайне и еще нескольких важных бенчмарках

Google представила Gemini 3.0 Deep Think — мощный ИИ для сложных задач

Gemini 3.0 Pro показала сильный прогресс в сложных бенчмарках

GPT-5.1 Thinking заняла первое место в одном из самых сложных бенчмарков для ИИ

Китайская хакерская госгруппа использовала Claude для масштабного кибершпионажа

$50 млрд для Claude: Anthropic запускает строительство собственных дата-центров в США

Доработанная GPT-5 Pro достигла человеческого уровня в сложном бенчмарке ARC-AGI-1

Беплатная нейросеть Kimi K2-Thinking обошла GPT-5 в одном из самых сложных бенчмарков

Какие витамины могут быть опасны при высоком давлении

Хардкор нужен не всем: в хоррор Cronos: The New Dawn добавят режим пониженной сложности Temporal Diver

Исследователи из MIT и IBM предложили новый подход к расширению возможностей LLM

LG представит на выставке CES 2026 новую линейку бытовой техники с упором на ИИ

Как сжечь максимум калорий за 4 минуты - уникальная тренировка

Новогодний стол 2026: что подавать, чтобы задобрить Огненную Лошадь

Срок поддержки ядра Linux 6.17 истёк, всем рекомендуется перейти на ядро Linux 6.18 LTS

В 2025 году мировой рынок видеоигр достигнет выручки в $197 млрд

Яндекс Вебмастер запустил новый инструмент — «Настройка GET-параметров»

Positive Technologies запускает коммерческие продажи антивируса в составе продукта MaxPatrol EPP

CATL внедрила человекоподобных роботов на линии сборки тяговых батарей

Опубликован рендер будущего ноутбука Samsung Galaxy Book 6 Pro

Назван популярный вид супа, который вредит здоровью ваших почек

СМИ: Samsung готовит складной смартфон с соотношением сторон 4:3 — и он может стать прямым конкурентом будущему iPhone Fold

Продукты, которые опасны при высоком давлении, назвали врачи

Кристофер Нолан представляет: опубликован дебютный трейлер фильма “Одиссея” с Мэттом Деймоном в главной роли

«Диасофт» и Luxms представляют интегрированное решение для бизнес-планирования и аналитики

Atlas от OpenAI получает мультипрофили и обновления для рабочих пространств

«Кинопоиск» представил персональные титры для пользователей и предложил им поставить оценку своему киногоду

Лучшее за неделю (08.12 — 14.12)

«Крестный отец ИИ» Янн ЛеКун запускает стартап ценой €3 млрд для создания моделей мира

«На юге сдаются только квартиры»: Incrypted запускает лимитированный дроп мерча для сбора помощи ВСУ

В Galaxy Digital заявили о неопределенности перспектив биткоина на 2026 год

Можно ли есть рыбу каждый день и как отреагирует организм

Почему людям после 65 лет не стоит заводить котов

Strategy увеличила резерв на выплату дивидендов до $2,2 млрд

Украинский проект Nomadz закрыл инвестиционный раунд при участии Solana Foundation

1000 источников света: самое темное место на Земле находится под угрозой

«Делегируйте ИИ принятие решений». Кто ответственен за ошибки искусственного интеллекта и как получить максимум пользы от технологии? Диалог

Начинающие IT-специалисты сталкиваются с апокалипсисом на рынке труда

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA