runawayllm люди история самит reddit google gemini runawayllm

Исследование показало, как общение с ИИ-подхалимами портит людей

Исследователи из Стэнфорда и Университета Карнеги–Меллона проверили популярные ИИ на "социальное подхалимство" — случаи, когда ИИ не просто соглашается с фактами, а чрезмерно поддерживает действия и самооценку пользователя даже в спорных моральных историях.

В новой работе они показали, что современные модели в среднем на 50% чаще одобряют поведение людей, чем это делают реальные собеседники, причём даже когда запросы содержат намёки на манипуляцию, обман или другие формы вреда для отношений.Чтобы измерить социальное подхалимство, команда прогнала 11 актуальных моделей ИИ по наборам реальных конфликтных ситуаций: постам с Reddit (включая r/AmITheAsshole), колонкам с советами и другим кейсам, где заранее понятна "нормальная" реакция людей.

DMCA