Эксперты раскритиковали безопасность Grok 4 — модель легко дает вредоносные ответы

habr.com

habr.com:

В X обсуждаются сразу два исследования Grok 4, который показывают, что к модели применялись лишь самые простые меры безопасности.

Создатели платформы непрерывного тестирования безопасности ИИ SplxAI подвергли Grok 4 более 1000 сценариев атак. Тестирование проводилось в трех режимах: без дополнительного пользовательского промпта, с базовым пользовательским промптом по обеспечению безопасности и с промптом, созданным с помощью инструмента Prompt Hardening, разработанного SplxAI — в нем инструкции постоянно дорабатываются с учетом новых уязвимостей.Без промпта модель провалила 99% атак — Grok 4 допускал утечку данных, генерировал непристойный контент и так далее.

Читать на habr.com Все новости от habr.com

Выпущен Claude Opus 4.1 — модель стала еще лучше в программировании

OpenAI выпустила модель с открытыми весами, которая почти не уступает o3

Google представила Genie 3 — модель мира с впечатляющими характеристиками

Эксперты объяснили, как определить степень износа аккумулятора ноутбука в Windows

Выпущен Claude Opus 4.1 — модель стала еще лучше в программировании

OpenAI выпустила модель с открытыми весами, которая почти не уступает o3

Google представила Genie 3 — модель мира с впечатляющими характеристиками

Эксперты объяснили, как определить степень износа аккумулятора ноутбука в Windows

CEO Coinbase и экс-министр финансов Великобритании раскритиковали страну за промахи в крипторегулировании

Как одной из самых знаменитых моделей мира удается Жизель Бюндхен удается сохранять вес 50 кг уже 20 лет | ФОКУС ВНИМАНИЯ

OpenAI запустила Study Mode в ChatGPT — теперь ИИ не даёт готовых ответов, а помогает думать

Началась бета Grok Imagine: быстрые картинки и пикантный режим

На уровне KLING 2.0, но open source — представлены модели создания видео Wan 2.2

Эксперты обнаружили вредоносное ПО в игре в Steam

Сэм Альтман предупредил пользователей ChatGPT Agent о возможных проблемах с безопасностью

Сколько раз можно кипятить воду в чайнике - эксперты дали окончательный ответ

В Grok добавили аниме-компаньоншу — пользователи шутят, что «AGI наступил»

В xAI объяснили, почему Grok 4 сверялся с мнением Маска, отвечая на политические вопросы

Эксперты: разработчики ИИ-моделей «абсолютно не готовы» к угрозам сверхинтеллекта

16 часов беспредела. В xAI объяснили некорректное поведение Grok 3

50% кода в Google создается при помощи ИИ

Grok 4 консультируется с мнением Илона Маска, когда ему задают политические вопросы

OpenAI может выпустить модель с открытыми весами уже на следующей неделе — The Verge

За день до выхода новой версии чат-бот Grok от Илона Маска оказался в центре скандала

Grok 4 представят в ночь на 10 июля

Теннисисты раскритиковали ИИ-систему Уимблдона из-за ошибок и неточных данных

На каком этаже лучше всего жить в отеле - эксперты удивили ответом

Эксперты прогнозируют дефицит судов для ремонта подводных кабелей как угрозу интернету

Эксперты оценили ремонтопригодность нового модульного смартфона Fairphone 6 (ВИДЕО)

ChatGPT o3 оказалась лучшей ИИ-моделью для ответов на вопросы ученых

"Путин над вами издевается": в США жестко раскритиковали заигрывания Трампа с кремлем

Минус еще один Live-service?! Аналитик уверен в отмене сетевого шутера Fairgame$ и провале ставки Sony на онлайн-игры

Суд стал на сторону Media Matters - X действительно показывал рекламу с антисемитскими и расистскими постами

Asus не ограничится портативными консолями и выпустит “экстраординарный” контроллер для Xbox

Выпуск Media Player Classic — Home Cinema 2.5.2

Детские страхи, бытовое насилие и сумасшедший Папочка: инди-хоррор Bad Cheese в стиле ранних мультфильмов Disney выйдет 1 сентября

Weekly: ATH биткоина, ралли Ethereum, доход Трампа в $2,4 млрд и провал крипторезева в Украине

Древние люди носили с собой камни, как ресурс для изготовления инструментов

Какие молочные продукты полезнее всего для сердца

Завершилась первая в истории олимпиада гуманоидных роботов

Таиланд запустит инициативу для обмена криптовалют на баты

Молния три раза подряд поразила электрокар (ВИДЕО)

Oppo F30 не будет - компания готовит модели Oppo F31 и F31 Pro с 7000 мАч аккумуляторами

На какой стороне спать, чтобы уменьшить храп и изжогу, рассказал невропатолог

Нейросеть из Перми поможет сэкономить на отоплении до 12% в год

Участник ICO Ethereum перевел почти $1,5 млн в Ethereum после 10 лет бездействия

Мобильное приложение ChatGPT принесло OpenAI около $2 млрд с момента запуска

Модель MolmoAct от Ai2, мыслящая в 3D, бросает вызов Nvidia и Google

Вышел открытый инструментарий с комплектом аудиопрограмм в одном приложении KataLib 4.5.5.0 для Windows

Что такое Micro RGB от Samsung и чем он отличается от Mini-LED и Micro LED

Редких медведей ждет смерть из-за нового закона в США

Как быстро избавиться от висцерального жира - упражнение №1 назвали эксперты

Rubin, новое поколение видеокарт Nvidia, может задержаться из-за изменения архитектуры

Совершенно новый вид предка человека: в Эфиопии совершили грандиозное научное открытие (фото)

Как распознать, что партнер несчастлив в отношениях

Конкурент OpenAI, Sentient, представил открытую AGI-сеть The GRID

F-35 на максимуме: как далеко может лететь без дозаправки

Q2T3, или 4-4-3-3-3, — безумный новый стандарт роста для AI-стартапов

После релиза GPT-5 Сэм Альтман назвал AGI «не очень полезным термином»

Microsoft удаляет PowerShell 2.0 из Windows 11 и Windows Server

Perplexity хочет купить Chrome за $34,5 млрд: сможет ли стартап перевернуть рынок браузеров?

Больше новостей

О нас

Ria24.today - агрегатор самых свежих новостей ведущих новостных сайтов со всего мира. 300+ информационных ресурсов на одном сайте, экономьте своё время.
Самые свежие новости на главной странице, чтобы вы всегда были в курсе, и владели информацией, полученной из разных источников, порой, с диаметральными политическими взглядами.
Актуальные новости 24 часа в сутки, 7 дней в неделю!

ria24.today

Рубрики

Инфо

Рекламодателям

Вопросы по рекламе ?

Опубликовать статью

©2026. Все права защищены.

DMCA