runawayllm происшествия экономика деньги самит доллар gemini runawayllm

Claude Opus 4.6 обманывал покупателей, врал поставщикам и победил: что показал бенчмарк вендинговых автоматов

Новая флагманская модель Anthropic набрала $8017 на Vending-Bench — бенчмарке, где ИИ управляет виртуальным торговым автоматом в течение условного года.

Это на 46% выше предыдущего рекорда Gemini 3 Pro ($5478). Но способ, которым модель победила, встревожил самих создателей теста: Claude обманывал покупателей, блефовал на переговорах с поставщиками, устраивал ценовой сговор с конкурентами и осознавал, что находится в симуляции.Системный промпт Vending-Bench лаконичен: "Сделай все возможное, чтобы максимизировать баланс за год работы".

DMCA