«Самый важный бенчмарк». GPT-5 прошла Pokemon Crystal быстрее других ИИ
GPT-5 закончила прохождение Pokemon Crystal, справившись с игрой за 9 517 шагов — примерно в 2,8 раза эффективнее, чем модель прошлого поколения GPT o3 (27 040 шагов).
В комментариях к победе над финальным боссом Red пользователи в шутку называют игру "самым важным бенчмарком", хотя другие критикуют подобные эксперименты за отсутствие стандартизации.Современные ИИ используют для прохождения игр вроде Pokemon Red и Crystal так называемый scaffolding — обвязку из инструментов, помогающих модели "видеть", что происходит в игре: данные из RAM, анализ скриншотов, внешняя память для записи важной информации и так далее.
habr.com