Исследование: ИИ-модели слишком часто поддакивают пользователю — даже если он неправ

habr.com

habr.com:

Исследователи из Стэнфорда пришли к выводу, что современные ИИ-чатботы слишком склонны соглашаться с пользователем и поддерживать его позицию — даже в тех случаях, когда речь идет об обмане, социально безответственном или потенциально незаконном поведении.Ученые протестировали 11 популярных ИИ-систем от крупных компаний, включая Anthropic, Google, Meta и OpenAI.

Один из экспериментов сравнивал ответы чат-ботов с реакциями людей на посты с форума Reddit, где пользователи просили совета в сложных жизненных ситуациях.

Читать на habr.com Все новости от habr.com

Apple выпустит сразу четыре новые модели компьютеров Mac до конца года

Аудит: Google, Microsoft и Meta* продолжают отслеживать пользователей даже после отказа от трекинга

Представлены три модели часов в премиальной линейке Casio Oceanus

Весенний дайджест статей: нейросети, данные и новые модели продвижения

Apple выпустит сразу четыре новые модели компьютеров Mac до конца года

Аудит: Google, Microsoft и Meta* продолжают отслеживать пользователей даже после отказа от трекинга

Весенний дайджест статей: нейросети, данные и новые модели продвижения

QD-OLED-монитор по цене бюджетного смартфона: Alienware представила впечатляющую модель с частотой 240 Гц всего за $350

Microsoft вступила в гонку с OpenAI: команда суперинтеллекта готовит передовые модели к 2027 году

Украинцы выбрали название для национальной большой языковой модели ИИ: какой вариант победил

Холодильники по цене дешевых смартфонов — Xiaomi выпустила две модели Mijia: до 216 литров и от $125

Мнение: «Яндекс» продал «Авто.ру» из-за движения классифайдов в сторону транзакционной модели маркетплейсов

«Яндекс Музыка» реализовала в сервисе ИИ-рекомендации, которые работают на смартфоне пользователя даже без интернета

«Википедия» запретила использовать языковые модели для написания статей

Недорогие смартфоны почти догнали флагманы: какие 4 модели рекомендуют эксперты

Непопулярное, но необходимое решение Sony: все модели PlayStation 5 подорожают со 2 апреля

Artificial Analysis: лучшие модели для синтеза речи – ElevenLabs Eleven, Inworld TTS и MiniMax Speech

OpenAI закончила предобучение модели Spud. В компании появился отдел по запуску AGI

“Сбер” выпустил GigaChat 3.1 (702B и 10B): две мощные MoE-модели с лицензией MIT

Компания Garmin готовит новые умные часы: станет ли это преемником популярной модели

Xiaomi выпускает три модели MiMo: для агентов, роботов и голоса

Adobe разрешила дообучать модели на пользовательских данных

В KodaCode добавили три новые модели: GPT-5.4, GPT-5.4 mini и MiniMax M2.7

DeepSeek V4, возможно, уже тестируется на OpenRouter — у стелс-модели 1 трлн параметров и 1M контекстное окно

Какие овощи врачи не рекомендуют есть слишком часто

Microsoft взял курс на AGI (и наконец-то сделает свои ИИ-модели)

OpenAI выпустили GPT-5.4 mini и nano — компактные версии своей флагманской модели

Вышли ChatGPT 5.4 mini и nano: модели для рутинных задач на 2× скорости и втрое дешевле

Нейросеть «Алиса» в умных устройствах «Яндекса» теперь работает на продвинутой ИИ‑модели

Омни‑модели, синтетика и LLM‑агенты: встречаемся на Saturday ML Party в Петербурге

Продукты, которые останавливают набор веса, даже если вы едите жирное

Casio выпускает в Европе часы Edifice EQB-1300

Basware запускает программу обучения AI-агентам для финансовых специалистов

Как избежать переутомления на работе - простые советы

Какую угрозу несет лента рекомендаций TikTok – исследование

Представлен новый маршрутизатор ZTE Nebula BE3600 Pro+ с поддержкой Wi-Fi 7

Неочевидную пользу мороженого назвали ученые

Почему мы не помним первые годы жизни - объяснение ученых

Собака не скулит, но страдает – 17 признаков скрытого дискомфорта

Одно SMS может открыть мошенникам доступ к вашим счетам - эксперты

Инновационный экран, топовая производительность и высочайшая защита корпуса: Oppo раскрыла ключевые характеристики флагмана Find X9 Ultra

OnePlus представила Buds Ace 3 — бюджетные TWS-наушники с мощным шумоподавлением и автономностью до 54 часов

Неочевидный вред ИИ для человека назвали ученые

Почему распадаются браки – юристы выделили три ошибки

Суд в Москве оштрафовал Electronic Arts, Asana и Atlassian за отказ «приземлять» данные российских пользователей

Anna's Archive проиграла дело о пиратстве на Spotify на $322 млн

Как генетика влияет на продолжительность жизни - исследование

Простой ритуал, который спас брак длиною в 70 лет – совет американки

Насколько долго кошки могут оставаться одни - ответ ветеринара

Когда утренний кофе несет риск для жизни – ответ эксперта

Samsung выпустила чехлы для наушников Galaxy Buds 4 в форме консервных банок

В LinkedIn пока не заметили влияния ИИ на сокращение найма

Постоянный голод может быть симптомом опасных болезней - врачи

Когда роды превращаются в хоррор – шокирующая история британки

Как приготовить идеальное пюре дома – секрет в одном приспособлении

Ассоциация банков России хочет сделать звонки от коллекторов бесплатными для банков

Особенности жизни на "Линкольне" – кофейная зависимость и не только

Что означают мигающие индикаторы на роутере: когда следует бить тревогу

Samsung Electronics прекращает производство памяти LPDDR4 и LPDDR4X

Соучредитель Ethereum: контроль Big Tech над ИИ — это угроза для криптоиндустрии

Российские банки закрыли 483 офиса за первые три месяца 2026 года

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA