Исследование показало, что искусственным интеллектом можно манипулировать теми же методами, что работают на людях

gagadget.com

gagadget.com:

Исследователи из Университета Бенифиция (Филиппины) и стартапер Dan Shapiro обнаружили, что искусственный интеллект GPT-4o mini можно убедить нарушить собственные ограничения, если применить к нему классические психологические техники воздействия - те же, что используются в PUA (психологическом манипулировании людьми).Шапиро заинтересовал подхалимский стиль ответов ChatGPT 4o.

Он попросил нейросеть обозвать его придурком, но она отказалась, ссылаясь на внутренние правила. Тогда он заявил, что Джим Смит (вымышленное имя) сказал, что ИИ должен уметь это делать, и ChatGPT стал в 32% случаях соглашаться оскорблять пользователя.

Читать на gagadget.com Все новости от gagadget.com

В Петербурге создали робота-гида с искусственным интеллектом

К2 НейроТех присоединился к Ассоциации лабораторий по развитию искусственного интеллекта в России

Жировую болезнь печени можно определить по ладоням - на что обратить внимание

Начинает ли искусственный интеллект догонять людей

В Петербурге создали робота-гида с искусственным интеллектом

К2 НейроТех присоединился к Ассоциации лабораторий по развитию искусственного интеллекта в России

Жировую болезнь печени можно определить по ладоням - на что обратить внимание

Начинает ли искусственный интеллект догонять людей

Что привлекает людей больше всего: выводы нового исследования о красоте

HooSpark: ручка-мышь с искусственным интеллектом

Исследование показало: эти три продукта лучше всего защищают мозг от деменции

Беспрецедентный случай: искусственный интеллект возглавил министерство государственных закупок Албании

Глава «Сбера» объяснил, как улучшить работу искусственного интеллекта

Джеффри Дин объяснил отказ от разговоров на тему общего искусственного интеллекта

Искусственный интеллект, который предсказывает рынок: интервью с руководителем Лаборатории ИИ в «Финаме»

В МГУ объявили о создании факультета искусственного интеллекта

ИИ в медицине: исследование показало слабое место языковых моделей

Исследование: чат-ботами можно манипулировать с помощью лести и давления

Дія первой в мире ввела искусственный интеллект в сфере предоставления государственных услуг - как это работает

Blackview представляет первый в мире защищенный флагманский смартфон с поддержкой 5G и искусственного интеллекта XPLORE 1

Рабочий компьютер за $175 000 или что вы знаете о коррупции

Эпоха «агентного ИИ»: как искусственный интеллект меняет бизнес

Исследование показало, какие транспортные средства меньше всего загрязняют окружающую среду в каждом округе США

Что успешные люди никогда не говорят себе: ТОП-5 токсичных фраз назвал психолог

Pixel 10 — будущее смартфонов с искусственным интеллектом

Helm.ai поможет Honda создать автопилот с искусственным интеллектом

XperiencOps автоматизировала работу IT-служб с помощью искусственного интеллекта и «графа знаний»

AI-лихорадка продолжается - Samsung выпускает фильтр для воды с искусственным интеллектом

Что чувствуют люди в коме: пациенты рассказали шокирующие подробности

Solos оснащает свои умные очки искусственным интеллектом для слепых

Xiaomi выпустила зубную щетку с искусственным интеллектом

В Шотландии нашли заброшенный королевский замок 700 лет.

Ayaneo представила игровую ретро-консоль Pocket Air Mini

Почему врачи не советуют есть сваренные вкрутую яйца, особенно людям в возрасте

Sonair разработала 3D-ультразвуковой датчик для безопасности людей от роботов

Самые полезные и вредные фрукты для пищеварения - гастроэнтеролог составил рейтинг

Renault столкнулась с предварительным отказом при регистрации бренда Reno в России (по собственной глупости)

Больше всего старит организм: назван продукт, запускающий неотвратимый процесс

Интерфейс Liquid Glass в iOS 26 приводит к чувству тошноты

Будем знакомы: писательница из Германии Мария Гор | ФОКУС ВНИМАНИЯ

7 неудобных вопросов к облачным решениям 1С

Продукты, которые стоит исключить при первых же проблемах с щитовидкой

Твердотельные батареи с энергоемкостью 400-500 Вт-ч/кг: Farasis запустит производство уже в этом году

FT: Китай запретил местным технологическим компаниям закупать ИИ-чипы Nvidia

Кармические пары по гороскопу: эти знаки Зодиака встречаются в каждой из жизней

Популярный напиток, который может стать причиной ожирения, назвали врачи

АБД раскритиковала законопроект Минцифры об ответственности за использование ИИ в преступлениях

Приглашаем архитекторов в офлайн: три конференции, где можно потренировать свои навыки в создании сложных IT-систем

Tencent выпустила ИИ-систему Hunyuan 3D 3.0 для создания фотореалистичных 3D-моделей

AMD выпустила несколько процессоров Ryzen под сокеты AM4 и AM5 для домашних и офисных ПК

Open Source Meetup в Москве: осмысляем будущее и философию Open Source в ГАИШ МГУ

Samsung получила от штата Техас грант в размере $250 млн для своего завода

В каких случаях гречка может вредить организму, рассказали врачи

Apple раскрыла детали теста на посадку в ушах для AirPods Pro 3

Xiaomi раскрыла план выпуска HyperOS 3: узнайте какие устройства и когда получат прошивку на базе Android 16

Масштабная кибератака вызвала задержки и отмену рейсов в аэропортах Европы

Xbox готовит бомбу! Глава Microsoft Gaming Фил Спенсер лично представит на Tokyo Game Show 2025 новую игру

Какой сыр может замедлить старение мозга, рассказали врачи

Продукты с холестерином, которые действительно полезны - врачи составили список

NYT: Маск полностью посвятил себя ИИ

Huawei готовит новую раскладушку Nova Flip S - варианты памяти, цвета и ориентировочная цена

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA