Исследователи смогли взломать 12 популярных систем безопасности ИИ

habr.com

habr.com:

Специалисты OpenAI, Anthropic, Google DeepMind и Гарварда опубликовали препринт нового исследования: они попытались сломать популярные системы безопасности ИИ и почти везде нашли обход.

Проверяли 12 распространенных подходов к защите, от "умных" формулировок системного промпта до внешних фильтров, которые должны ловить опасные запросы.

Читать на habr.com Все новости от habr.com

В AMD признали наличие ошибки безопасности в генераторе RDSEED в части процессоров на архитектуре Zen 5

Исследователи показали систему, которая способна создавать реалистичные 3D-модели городов

Как выглядит идеальный день для человека, выяснили исследователи

Иллюзия безопасности: украинская молодежь массово игнорирует угрозы в интернете

В AMD признали наличие ошибки безопасности в генераторе RDSEED в части процессоров на архитектуре Zen 5

Исследователи показали систему, которая способна создавать реалистичные 3D-модели городов

Как выглядит идеальный день для человека, выяснили исследователи

Иллюзия безопасности: украинская молодежь массово игнорирует угрозы в интернете

Врачи развеяли мифы о пользе популярных «здоровых продуктов»

Слепые пациенты смогли читать благодаря умным очкам

Исследователи показали позиционирование с точностью до сантиметра с помощью умных часов

Исследователи построили поглощающий углекислый газ 3D-печатный мост

Домашние животные под угрозой: 10 популярных мифов, которые вредят питомцам

Исследователи предложили единое определение искусственного общего интеллекта

Google Gemini 3.0 Pro создала клоны популярных игр

Компания кибербезопасности F5 сообщила о взломе систем и краже исходного кода

Китайские исследователи полностью восстановили повреждённый свиток IV века с поэмой, используя технологии ИИ

Японские исследователи открыли напиток, который спасает печень от ожирения

Исследователи показали атаку Pixnapping на Android для захвата данных приложений

Ректор МГУ: новый факультет искусственного интеллекта (ИИ) должен стать одним из самых популярных среди абитуриентов

Представлен человекоподобный робот Figure 03. Цель — безопасное применение дома

В какое время суток наибольший риск стать жертвой мошенников – исследователи

Исследователи при помощи BlueToolkit обнаружили в Bluetooth-системах автомобилей 128 уязвимостей

У ChatGPT уже 800 миллионов пользователей в неделю, а популярность Codex выросла в 10 раз

Тайны долголетия 117-летней Марии раскрыли исследователи

Исследователи представили атаку Mice-E-Mouse для прослушивания пользователей с помощью геймерской мышки

Strava подала в суд на Garmin из-за популярных фитнес-функций

Физики смогли найти лазейку в принципе неопределённости Гейзенберга, не нарушая его

Три популярных витамина, которые нельзя принимать перед сном

Роскачество представило исследование манипулятивных механик в популярных мобильных играх в РФ

Исследователи представили Dexop — кистевой экзоскелет для обучения роботов хватать предметы

В Германии начали давать в аренду видеокарту Intel Arc Pro B60 с 24 ГБ видеопамяти

Роботакси Waymo готовятся к масштабной экспансии

Пользователь заплатил $105 000 комиссии в сети биткоина при переводе $10

Существует ли квантовая гравитация: открытие физиков меняет понимание главных сил природы

Блогер провёл двухгодичный эксперимент по изучению влияния быстрой зарядки на состояние аккумуляторов 40 смартфонов

Расширенные обновления безопасности Windows 10 не будут работать на некоторых ПК

И мы снова зажигаем ваши сердца! В ноябре Хабр проводит еще один «Авторский огонёк»

Шмели так хотели сладкого, что выучили простейшую азбуку Морзе: никто не ожидал от них такого

Семья годами жила в доме с тысячами пауков: у ученых нет объяснения этому явлению

Почему одни люди боятся холода, а другие нет: раскрыта тайна того, что превращает нас в мерзляков

СМИ: в РФ с 1 сентября 2026 года планируется технологический сбор для импортёров для поддержки отечественных технологий

Вышла версия открытого проекта для редактирования видео LosslessCut 3.67

Бывший топ-менеджер BlackRock считает Ethereum основой будущих финансов

Google запускает Private AI Compute — облачную платформу ИИ с максимальной защитой данных

Sony представила первый геймерский монитор под брендом PlayStation с диагональю 27" и частотой до 240 Гц

Официально: хоррор-сериал “Чужой: Земля” получит второй сезон

Apple расширила действие функции Emergency SOS на Мексику

«Логистический суперхаб». Украинский Ajax Systems открыл завод во Вьетнаме. Какова выгода?

a16z представила первые предложения в рамках GENIUS Act

Древнеримский театр в Турции раскрыл имя важной жрицы: что известно ученым (фото)

Яндекс обновил Мастер отчетов: больше возможностей для удобного анализа данных

AI-рынок потерял $800 млрд за неделю

Команда открытого проекта runc столкнулась с ростом pull-request и отчётов об ошибках, сгенерированных ИИ

Точно не инопланетяне. Астрономы получили первый «радиосигнал» от кометы 3I/ATLAS

Землю накрыла сверхсильная магнитная буря: она практически достигла уровня G5

Первые подробности Galaxy Z TriFold: складной смартфон получит аккумулятор емкостью 5600 мА·ч и выйдет 5 декабря

Как цитрусовые помогают быстрее выздороветь при простуде - советы и лайфхаки от врача

Почему всё время хочется есть? Виноваты гормоны голода | ФОКУС ВНИМАНИЯ

Почему собаки наклоняют голову, когда вы с ними говорите? Это не просто милая привычка

FT: главный исследователь Meta по ИИ покинет корпорацию ради своего стартапа

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA