Математики потратили $550 000 на тест, который ИИ не может решить

habr.com:

Группа из 64 математиков — профессора, постдоки, аспиранты и медалисты международных олимпиад — создала бенчмарк SOOHAK из 439 задач исследовательского уровня.

Каждая задача написана с нуля, без использования ИИ, и прошла пятиступенчатую проверку: от автоматического скрининга до ручного аудита.

Читать на habr.com Все новости от habr.com

Portronics Titan 35: павербанк на 20 000 мА/ч, который заменит сумку и кучу проводов

Специя, которая поможет предотвратить диабет, назвали ученые

Ошибка, которая может привести к проблемам в аэропорту

Привычку, которая поможет улучшить зрение,назвал врач

Portronics Titan 35: павербанк на 20 000 мА/ч, который заменит сумку и кучу проводов

Специя, которая поможет предотвратить диабет, назвали ученые

Ошибка, которая может привести к проблемам в аэропорту

Привычку, которая поможет улучшить зрение,назвал врач

Математики разгадали загадку числа 42

Оказывается, Интернет-сервис — это независимое третье лицо, которое может подтвердить или опровергнуть информацию

Фрукт, который может предотвратить инсульт, назвали врачи

Специю, которая может уберечь от диабета, назвали эксперты

Математики разгадали многолетнюю загадку о порядке, скрытом в многомерной случайности

Метод "3-2-1", который поможет иметь сильное тело после 50 лет

Назван продукт, который может снизить риск онкологии у мужчин

Счастливый цвет по дате рождения, который поможет привлечь богатство

Робот-поводырь, который может действовать автономно в открытой среде

120-секундная тренировка, которая может спасти от деменции

«Гипотезу Римана может доказать анонимный аккаунт»: математик MIT — об опыте работы с GPT-5.5-Pro

Привычка перед сном, которая может быть предвестником диабета

Lenovo создала робота, который поможет на работе

Процессор на стероидах для Марса: NASA тестирует чип, который в 500 раз быстрее текущих решений

Уникальный продукт, который может стать эффективной профилактикой рака

Рыбу, которая может "угробить" ваше здоровье, назвал врач

Selectel запустил программу поддержки AI-проектов с грантом до 2 000 000 ₽

Фрукт, который поможет уснуть, назвали ученые

Google разрабатывает ИИ-агента, который может стать ответом на OpenClaw

Anker Air+ Ultra Slim: 10 000 мА·ч, которые не превращают iPhone в «кирпич»

Фактор, который может продлить жизнь, назвали ученые

Простая привычка, которая может снизить биологический возраст

Asus представила новинки ROG в честь двадцатилетия бренда

Несколько американских штатов готовят иски, чтобы заблокировать сделку Paramount по поглощению Warner Bros

Samsung тестирует One UI 9 на десятках устройств Galaxy: в списке появились популярные модели A-серии

ТОП-5 ИБ-событий недели по версии Jet CSIRT

В Ubisoft вновь сокращения: компания закрыла две студии и уволила почти четыреста человек в разных подразделениях

Telegram снова на Apple Watch: вышло новое нативное приложение

Названа оптимальная температура в комнате для комфортного сна

Что добавить в воду, чтобы быстрее худеть, рассказали специалисты

Журналисты в восторге от Ксеноморфа: опубликованы первые геймплейные кадры Alien Isolation 2

МТС Банк усиливает безопасность цифровых сервисов с помощью PT Application Inspector

Где вероятнее всего можно подвергнуться атакам акул - список стран

Прозрачный, мощный и холодный: ASUS представила игровой десктоп TUF Gaming TM700 с графикой RTX 50, чипами Ryzen и продвинутой системой охлаждения

На следующей неделе подписчики PS Plus Extra и Premium получат отличный набор игр, среди которых Final Fantasy XVI и Kingdom Come

Продукты, которые зря считаются полезными, назвали диетологи

Более 5000 лет микробиома Этци: удивительное открытие ученых

Амбициозный украинский шутер SAND: Raiders of Sophie сегодня не выйдет — его экстренно перенесли и выпустят в формате раннего доступа

Как дожить до ста лет - ученые раскрыли секрет

Доступные продукты, которые способствуют долгой жизни, назвали врачи

Энтузиаст запустил Half-Life на телефоне Nokia N95

ПМЭФ-2026: что меняется в автоматизации бизнеса

Следственный комитет РФ сообщил о задержании 24 организаторов онлайн‑казино

Стильный геймерский флагман Red Magic 11S Pro дебютировал на глобальном рынке — он обеспечивает топовую производительность и выделяется смелым дизайном

Какая температура у детей считается самой опасной

Жару можно перенести без включения кондиционера - главные лайфхаки

На онлайн-сервисы ВТБ совершена DDoS-атака

Приложение MotoSync+ для WiFi-роутеров Motorola перестало работать

Инсайдер раскрыл дизайн и цвета iPhone Fold

Как продлить срок службы батареи смартфона - простые советы

$1,8 трлн и 4000 новых миллионеров: журналисты оценили потенциал IPO SpaceX

Аналитики отметили худший за пять лет квартал для публичных токенсейлов

Больше новостей