Математики потратили $550 000 на тест, который ИИ не может решить
Группа из 64 математиков — профессора, постдоки, аспиранты и медалисты международных олимпиад — создала бенчмарк SOOHAK из 439 задач исследовательского уровня.
Каждая задача написана с нуля, без использования ИИ, и прошла пятиступенчатую проверку: от автоматического скрининга до ручного аудита.
habr.com