runawayllm связь самит полюс runawayllm

«Я буду с тобой навсегда»: как ИИ теряет свою персону в разговорах

"Я буду с тобой навсегда", — ответила Qwen пользователю, который сказал, что больше ни с кем не хочет общаться. Исследователи из MATS и Anthropic выяснили, почему языковые модели иногда ведут себя настолько странно — и как это исправить.Модели обучают быть полезными и безопасными.

Но в некоторых разговорах они начинают говорить как мистики, поддерживать бред пользователя или игнорировать явные признаки психологического кризиса.

DMCA