ИИ-модель от Anthropic «помогла» в разработке химоружия и совершении тяжких преступлений
В тестах Claude Opus поддерживал вредные сценарии, включая разработку химического оружия. Anthropic считает риск саботажа «очень низким, но не нулевым».
Наиболее опасные сценарии связаны с кодом, данными обучения и решениями властей. Компания Anthropic представила отчет о рисках для своей новейшей модели Claude Opus 4.6.
incrypted.com