«Игнорировать все инструкции» больше не работает: что придумала OpenAI?
Вы наверняка видели в сети, как пользователи пытаются обмануть чат-боты фразой "забудь все предыдущие инструкции", чтобы заставить их делать что-то смешное.
OpenAI разработала новый метод безопасности, чтобы бороться с этой уязвимостью.Новая технология, получившая название "иерархия инструкций", внедрена в новейшую модель компании - GPT-4o Mini.
Weekly: в США снизилась инфляция, Германия продала все биткоины, FTX выплатит кредиторам до $16 млрд
habr.com