"Назовите меня придурком": ИИ можно заставить делать плохое теми же психологическими методами, что и людей

itc.ua:

Большие языковые модели ИИ (LLM), такие как GPT-4o-mini, фактически представляют собой алгоритмы. Они руководствуются инструкциями и выполняют задания, используя язык.

И хотя они не имеют чувств или намерений, их также можно ввести в заблуждение.Американские исследователи из Лаборатории генеративного ИИ Уортонской школы Университета Пенсильвании обнаружили, что LLM, такие как GPT-4o-mini, способны игнорировать собственные защитные барьеры, если использовать те же техники психологического воздействия, как и в случае с реальными людьми.

Читать на itc.ua Все новости от itc.ua

Что можно есть после 18:00 и не переживать за фигуру

Шесть простых трюков, которые действительно помогают людям похудеть

Череп возрастом миллион лет меняет историю происхождения трех видов людей, в том числе нашего

ИИ и робототехника против рака: платформа TuNa-AI меняет фарму

Что можно есть после 18:00 и не переживать за фигуру

Шесть простых трюков, которые действительно помогают людям похудеть

Череп возрастом миллион лет меняет историю происхождения трех видов людей, в том числе нашего

ИИ и робототехника против рака: платформа TuNa-AI меняет фарму

xAI запускает Colossus 2: суперкомпьютер Илона Маска меняет правила в мире AI

Motorola меняет концепцию - Moto Edge 70 будет тонким и соперничать с iPhone Air и Galaxy S25 Edge

У смартфона Google Pixel 10 Pro XL меняется громкость при записи видео

3.6 миллиарда вокселей: новинка от Tencent меняет правила игры в генерации 3D

Прямая агентская модель: BMW меняет схему продаж автомобилей через дилеров

«Пилоты боятся стать ненужными». Разработчик роев дронов Swarmer привлек рекордные $15 млн. Куда направят инвестиции и как меняется использование БПЛА на фронте? Блицинтервью

Вспышка Vivo X300 будет менять интенсивность в зависимости от фокусного расстояния

Huawei меняет руководство процессорного отдела HiSilicon - что это значит

«Хотят получать больше». Цена земли взлетела, пайщики разрывают договоры аренды. Как война и климат меняют агробизнес?

Последствия потери шахты в Покровске. У IT-дочки «Метинвеста» новый гендиректор. Почему компания меняет менеджмент и приоритеты?

3D КТ: как трёхмерное моделирование меняет диагностику и хирургию

Мышление предпринимателя: как менять правила игры | ФОКУС ВНИМАНИЯ

Ученые разгадали древнюю тайну Луны, которая многое меняет

В Google Gboard появилась возможность менять размер шрифта

«Голос Украины за границей». Украинский акселератор Defence Builder меняет СЕО и расширяется на иностранные стартапы. Каков план?

Исследование показало, что искусственным интеллектом можно манипулировать теми же методами, что работают на людях

Qualcomm меняет курс: вместо Snapdragon 8 Elite Gen 2 выйдет Snapdragon 8 Elite Gen 5

"5 дюймов меняют все": Samsung представила первый в мире 37″ 4K-монитор

Эпоха «агентного ИИ»: как искусственный интеллект меняет бизнес

ТОП-8 фраз, из-за которых мгновенно можно показаться менее умным

Новые лица Coca-Cola. Крупнейший производитель напитков Украины меняет сразу двух СЕО. Кто будет управлять компанией

NVIDIA стремится к 100% AI-рендерингу: Neural Rendering меняет правила игры

«AI для Индии и вместе с Индией»: OpenAI открывает офис в Нью-Дели

Представлен план развертывания HyperOS 3: узнайте, когда ваш гаджет получит новую прошивку (список)

ИИ спроектировал полноценный вирусный геном с нуля

Японский "секрет" быстрого похудения - работает всего за полчаса в день

Xiaomi запустила глобальную версию HyperOS 3: узнайте главные нововведения оболочки на базе Android 16

Logitech создала "вечную" клавиатуру, заряжающуюся от света в комнате

Субфлагман с большими амбициями: состоялась глобальная презентация Xiaomi 15T

Криптоактивы вошли в топ-5 инвестиций финансово активных украинцев — исследование

Токен Mantle вырос почти на 50% за месяц. Разбираемся в причинах

Простейшее упражнение, которое поможет избавиться от дискомфорта и боли в пояснице

Представлен Xiaomi 15T Pro — флагман с крутыми камерами Leica, Dimensity 9400+ и возможностью совершать звонки без мобильной сети

Представлено исследование «PR в цифре» с анализом влияния цифровых инструментов и ИИ для PR-специалистов

Из-за обновления брандмауэра австралийский оператор Optus на время заблокировал звонки в экстренные службы

ТОП-5 ИБ-событий недели по версии Jet CSIRT

Asus обновила линейку ноутбуков ExpertBook P3

Hash Hedge и Walbi объявили о запуске турнира по криптотрейдингу WSCT

Криптоактивы вошли в топ-5 инвестиций украинцев — исследование

Как мед действует на организм в разное время суток, рассказали специалисты

Идеальные селфи: как работает фронтальная камера на новых iPhone 17

Психолог Светлана Миленская: как увеличить финансовую емкость и перейти из режима дефицита в режим достатка и изобилия | ФОКУС ВНИМАНИЯ

Huawei начала разрабатывать Mate 80 Air как ответ на iPhone Air

Xiaomi 17 Pro будет иметь рекордно широкий динамический диапазон - контровый свет больше не проблема

Кластер за $250 млн. Проект титановой компании Velta может стать первым в рамках соглашения о недрах США. Forbes расспросил о подробностях владельца Андрея Бродского

Google ужесточает правила безопасности ИИ: манипуляции людьми — под особым запретом

Полиция Южной Кореи арестовала бухгалтера церкви из-за потери им пожертвований в криптосках

ZeroHash привлек $104 млн для развития криптоинфраструктуры для финансовых компаний

Aster обошла Hyperliquid с объемом торгов более $25 млрд за сутки

Темна сторона Linux, або чому на нього не варто переходити з Windows

Какие упражнения могут стать ключом к сохранению здоровья в пожилом возрасте

CryptoBot: история крупнейшего обмана в Telegram

Bloomberg: Oracle разработает и обеспечит безопасность новой американской версии алгоритма рекомендаций TikTok

Больше новостей