Дебаты по поводу бенчмаркинга ИИ достигли Pokémon
Даже покемоны не защищены от споров о бенчмаркинге искусственного интеллекта. На прошлой неделе пост на X стал вирусным. В нём утверждалось, что последняя модель Google Gemini превзошла флагманскую модель Claude от Anthropic в оригинальной трилогии видеоигр Pokémon.
Сообщается, что Gemini достиг Лавандового города на стриме разработчика на Twitch, а Claude застрял на горе Мун в конце февраля.Но о чём не упомянули, так это о том, что у Gemini было преимущество.Как отметили пользователи на Reddit, разработчик, который ведет трансляцию Gemini, создал пользовательскую мини-карту, которая помогает модели распознавать «плитки» в игре, например, деревья, которые можно срубить.
CMF Phone 2 и новые наушники: Nothing намекает на четыре будущих продукта с кодовыми именами Pokémon
habr.com