runawayllm общество кибератаки полюс Nano gemini runawayllm

Чтобы взломать нейросеть, достаточно написать запрос стихами — исследование

Оказывается, чтобы обойти фильтры безопасности крупной языковой модели, не нужен ни хитрый код, ни экзотическая уязвимость: достаточно написать вредный запрос стихами.

Группа исследователей из лаборатории DEXAI показала, что поэтическая форма заметно повышает шансы на небезопасный ответ у современных нейросетей.

DMCA