runawayllm Южная Корея Олимпиада бюджет самит профессор интересное gemini runawayllm Южная Корея

Математики потратили $550 000 на тест, который ИИ не может решить

Группа из 64 математиков — профессора, постдоки, аспиранты и медалисты международных олимпиад — создала бенчмарк SOOHAK из 439 задач исследовательского уровня.

Каждая задача написана с нуля, без использования ИИ, и прошла пятиступенчатую проверку: от автоматического скрининга до ручного аудита.

DMCA