Исследование показало, как общение с ИИ-подхалимами портит людей

habr.com:

Исследователи из Стэнфорда и Университета Карнеги–Меллона проверили популярные ИИ на "социальное подхалимство" — случаи, когда ИИ не просто соглашается с фактами, а чрезмерно поддерживает действия и самооценку пользователя даже в спорных моральных историях.

В новой работе они показали, что современные модели в среднем на 50% чаще одобряют поведение людей, чем это делают реальные собеседники, причём даже когда запросы содержат намёки на манипуляцию, обман или другие формы вреда для отношений.Чтобы измерить социальное подхалимство, команда прогнала 11 актуальных моделей ИИ по наборам реальных конфликтных ситуаций: постам с Reddit (включая r/AmITheAsshole), колонкам с советами и другим кейсам, где заранее понятна "нормальная" реакция людей.

Читать на habr.com Все новости от habr.com

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

«ИИ написал 85% кода»: как четыре инженера OpenAI собрали Android-версию Sora 2 за 28 дней

Исследования показали, что попытка придать ИИ человеческое звучание происходит за счет потери смысла

Исследование показало: возраст, когда фертильность резко падает

Как устроена память в ChatGPT и Claude? Инженер вскрыл интересные особенности

«ИИ написал 85% кода»: как четыре инженера OpenAI собрали Android-версию Sora 2 за 28 дней

Исследования показали, что попытка придать ИИ человеческое звучание происходит за счет потери смысла

Исследование показало: возраст, когда фертильность резко падает

OpenRouter выкатили огромное исследование: как реально используют LLM (анализ 100 трлн токенов)

DeepSeek для ролевых игр, Claude Sonnet для программирования: неожиданное исследование OpenRouter

Как Gemini 3 Pro разбирает рукописи XVIII века и находит ошибки в тетрадях школьников