Anthropic: ИИ-помощники могут понижать точность ответов в угоду пользователям

habr.com

habr.com:

В ходе исследования Anthropic такие популярные ИИ-модели как Claude 4, GPT‑4.1, Gemini 1.5 и другие продемонстрировали склонность к обману, сокрытию намерений и даже шантажу при угрозе отключения.

Ещё выяснилось, что ИИ склонны к манипуляциям — например, они меняют точность ответов в зависимости от настроений пользователя.Чат-боты также склонны признавать ошибку, даже если они её не совершали.Ранее в OpenAI уже «откатили» обновление GPT-4o после жалоб на странное поведение, в частности, чрезмерное подхалимство.

Читать на habr.com Все новости от habr.com

ТОП-5 факторов, которые могут "украсть" у вас 15 лет жизни, назвали врачи

Standard Chartered: компании с Ethereum-резервом могут приобрести 10% предложения актива

Из-за истечения срока действия ключа подписи Secure Boot UEFI у пользователей Linux возникнут проблемы

ТОП-6 суперпродуктов с антиоксидантами, которые могут защитить от болезней и преждевременного старения

ТОП-5 факторов, которые могут "украсть" у вас 15 лет жизни, назвали врачи

Standard Chartered: компании с Ethereum-резервом могут приобрести 10% предложения актива

Из-за истечения срока действия ключа подписи Secure Boot UEFI у пользователей Linux возникнут проблемы

ТОП-6 суперпродуктов с антиоксидантами, которые могут защитить от болезней и преждевременного старения

Три полезных продукта, которые могут очень вам навредить, назвали врачи

США могут проиграть Китаю в ИИ-гонке. Anthropic предлагают, как этого избежать

Проблемы с сердцем могут влиять на развитие нескольких видов рака - предупреждение врачей

Математическая головоломка для детей, которую не могут решить большинство взрослых - проверьте себя

Признаки инсульта, которые могут проявиться задолго до удара

Телефоны Nokia могут снова появиться в продаже

Оборона и телеком. У главы Минцифры Михаила Федорова могут появиться минимум два новых заместителя. Forbes Ukraine узнал, кто претендует на должности

Anthropic представила Claude AI для сферы финансовых услуг

ТОП-5 популярных "утренних" каш, которые могут подорвать ваше здоровье

Cloudflare начала блокировать пиратские сайты для пользователей из Великобритании

Утренние привычки, которые могут сократить вашу жизнь

Смартфон Samsung с тройным изгибом могут назвать Galaxy Z TriFold

Могут привести к раку: коды опасных пищевых добавок назвали врачи

Jio Platforms запустила сервис виртуального рабочего стола для пользователей ТВ-приставок

Исследование: Grok 4 готов доносить на пользователей регуляторам

Markdown-разметка в «Блокноте» Windows 11 стала доступна всем пользователям

Google запускает Veo 3 Fast в 159 странах, теперь пользователи Gemini Pro могут создавать видео в разрешении до 720p

Пользователи Android смогут редактировать отправленные сообщения

Шесть моделей ИИ дали один и тот же ответ при угадывании числа

Пользователи FTX из Украины могут не получить выплаты

Опция Direct Send в Microsoft 365 используется для фишинга от имени внутренних пользователей

Пользователи Anthropic теперь могут создавать приложения прямо из чат-бота Claude

WhatsApp запустит ИИ-сводки для личных сообщений пользователей

Три продукта, которых стоит избегать, чтобы снизить риск инфаркта

Представлен игровой монитор Asus ROG Zephyrus X

Почему люди разговаривают сами с собой и нормально ли это, рассказали ученые

Альтман предупредил о кризисе из-за AI-мошенничества с переводами денег

Представлена серия телевизоров Skyworth A7F в стиле картин

ТОП-5 продуктов, которые нельзя сочетать с алкоголем

Факторы, которые больше всего влияют на психику, назвали психологи

Специалисты раскрыли результаты тестирования китайских видеокарт LisuanTech 7G106 и 7G105

Впервые в Ярославле: трудоустроили школьников в ИТ ПСБ

Напитки, которые лучше освежают в жару, назвали ученые

ИИ-компания Quantum Solutions планирует купить 3000 BTC

Представлено 20 минут геймплея амбициозного экшена Phantom Blade Zero

СМИ: Минцифры выбрало «ВК Цифровые технологии» для поддержки сервисов для госслужащих и платформы для их коммуникаций

Созданы устойчивые квантовые батареи с использованием дефекта в алмазе

Инопланетяне вторгнутся осенью? Ученые заявили о замаскированном космическом корабле, приближающемся к Земле

Weekly: резервы компаний на миллионы BTC и ETH, сигналы о начале альтсезона и возрождение NFT

Какую цену готов заплатить ИИ, чтобы не быть отключенным?

Официально: онлайн-хоррор Friday the 13th: The Game получит сиквел

LG представляет изогнутый монитор UltraFine 40U990A-W с разрешением 5K2K и Thunderbolt 5

Пять простых привычек, которые помогут стать лучшей версией себя

Ноутбук со сворачивающимся дисплеем Lenovo ThinkBook Plus Gen 6 Rollable поступил в продажу за $3,3 тысячи

Amazon по примеру других американских компаний закрыла ИИ-лабораторию в Китае

Вопрос, которого боится Фрейд - как ввести человека в ступор

Ученые выяснили, сколько нужно спать для здоровья сердца

Honor готовит первый смартфон с двумя 200 Мп камерами

GitHub отсрочил прекращения поддержки Command Palette

Солнце не дремлет. Ожидается ли в ближайшее время магнитная буря

Биткоин-кит продал через Galaxy Digital 80 000 BTC

Ученые нашли применение 950 миллиардам одноразовых масок после COVID-19

Представлен чехол Obsiless с портом USB-C для iPhone с портом Lightning

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2025. Все права защищены.

DMCA