технологии происшествия общество

«Игнорировать все инструкции» больше не работает: что придумала OpenAI?

Вы наверняка видели в сети, как пользователи пытаются обмануть чат-боты фразой "забудь все предыдущие инструкции", чтобы заставить их делать что-то смешное.

OpenAI разработала новый метод безопасности, чтобы бороться с этой уязвимостью.Новая технология, получившая название "иерархия инструкций", внедрена в новейшую модель компании - GPT-4o Mini.

DMCA