Мечта о ИИ-учёных разрушена: Gemini 3 Pro и GPT‑5 провалили задачи из астрофизики

habr.com

habr.com:

Новая регистрационная работа под названием “CritPt” собрана более чем 50 физиками из 30+ институтов, чтобы проверить, способны ли современные модели ИИ решать задачи, сопоставимые с работой аспиранта‑исследователя.

Benchmark включает 71 оригинальную задачу из 11 областей: квантовой физики, астрофизики, физики высоких энергий и биофизики, причём все задачи - не из учебников и не публиковавшиеся ранее.

Читать на habr.com Все новости от habr.com

Google добавил генерацию речи в Gemini API

Google запустил своего самого продвинутого ИИ-агента в день выхода GPT-5.2 от OpenAI

OpenAI представила GPT‑5.2 — новую версию ведущей языковой модели с улучшенной логикой и скоростью

Opera интегрировала Gemini в десктопные браузеры One и GX

Google добавил генерацию речи в Gemini API

Google запустил своего самого продвинутого ИИ-агента в день выхода GPT-5.2 от OpenAI

OpenAI представила GPT‑5.2 — новую версию ведущей языковой модели с улучшенной логикой и скоростью

ChatGPT захватил черную пятницу: переходы на ритейл‑приложения выросли на 28 процентов

Как Google собирается создать AGI: интервью с главным архитектором DeepMind

Учёные раскрыли слабые места ИИ: почему модели всё ещё не думают как люди

Голос, текст и картинки вместе: ChatGPT перезапустил голосовой режим

Gemini 3 Pro обошла 98 процентов людей по IQ

Nano Banana Pro добавили в LMArena, теперь её можно протестировать бесплатно

ChatGPT начал требовать паспорт у пользователей — безопасность или слежка?

OpenAI объявила о закрытии API GPT-4o в феврале 2026

Gemini 3 устроила временной шок и отказалась верить, что сейчас 2025‑й

Google запускает Gemini в Android Auto. ИИ-помощник теперь доступен за рулём

ChatGPT запустил групповые чаты по всему миру

OpenAI выпустила GPT-5.1-Codex-Max для тяжёлой разработки

Google DeepMind выпустила полный гайд по Gemini 3

Gemini 3 Pro вышла и уже доступна в AI Studio

Безос станет со-CEO нового AI-стартапа Project Prometheus

В ChatGPT появились групповые чаты, но пока в пилотном режиме

Google запускает Private AI Compute для безопасного использования Gemini в облаке

LAION запускает Project AELLA для структурирования научных публикаций с помощью ИИ

OpenAI выпустила GPT-5.1 с улучшенным интеллектом и качеством диалога

Gemini 3.0 Pro решает задачи, считавшиеся почти невозможными для ИИ

Исследование Гамбургского университета: рекомендации ChatGPT зависят от способа доступа

Казахстанские учителя получат бесплатный доступ к ChatGPT

Думающая Kimi K2 обошла GPT-5 в Последнем экзамене человечества

Apple выбрала Gemini для новой Siri

*Meta запускает PE-AV — аудио-визуальный энкодер для мультимодального ИИ

Какие витамины могут быть опасны при высоком давлении

Хардкор нужен не всем: в хоррор Cronos: The New Dawn добавят режим пониженной сложности Temporal Diver

Исследователи из MIT и IBM предложили новый подход к расширению возможностей LLM

LG представит на выставке CES 2026 новую линейку бытовой техники с упором на ИИ

Как сжечь максимум калорий за 4 минуты - уникальная тренировка

Новогодний стол 2026: что подавать, чтобы задобрить Огненную Лошадь

Срок поддержки ядра Linux 6.17 истёк, всем рекомендуется перейти на ядро Linux 6.18 LTS

CATL внедрила человекоподобных роботов на линии сборки тяговых батарей

Positive Technologies запускает коммерческие продажи антивируса в составе продукта MaxPatrol EPP

Яндекс Вебмастер запустил новый инструмент — «Настройка GET-параметров»

В 2025 году мировой рынок видеоигр достигнет выручки в $197 млрд

Опубликован рендер будущего ноутбука Samsung Galaxy Book 6 Pro

Назван популярный вид супа, который вредит здоровью ваших почек

СМИ: Samsung готовит складной смартфон с соотношением сторон 4:3 — и он может стать прямым конкурентом будущему iPhone Fold

Продукты, которые опасны при высоком давлении, назвали врачи

Кристофер Нолан представляет: опубликован дебютный трейлер фильма “Одиссея” с Мэттом Деймоном в главной роли

«Диасофт» и Luxms представляют интегрированное решение для бизнес-планирования и аналитики

Atlas от OpenAI получает мультипрофили и обновления для рабочих пространств

«Кинопоиск» представил персональные титры для пользователей и предложил им поставить оценку своему киногоду

Лучшее за неделю (08.12 — 14.12)

«Крестный отец ИИ» Янн ЛеКун запускает стартап ценой €3 млрд для создания моделей мира

В Galaxy Digital заявили о неопределенности перспектив биткоина на 2026 год

«На юге сдаются только квартиры»: Incrypted запускает лимитированный дроп мерча для сбора помощи ВСУ

Можно ли есть рыбу каждый день и как отреагирует организм

Почему людям после 65 лет не стоит заводить котов

Strategy увеличила резерв на выплату дивидендов до $2,2 млрд

Украинский проект Nomadz закрыл инвестиционный раунд при участии Solana Foundation

1000 источников света: самое темное место на Земле находится под угрозой

«Делегируйте ИИ принятие решений». Кто ответственен за ошибки искусственного интеллекта и как получить максимум пользы от технологии? Диалог

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA