Исследование OpenAI: больше времени на размышление делает AI более устойчивым к манипуляциям
Новое исследование OpenAI показывает, что модели AI становятся более устойчивыми к попыткам манипуляции, если им дать больше времени на «подумать».
Исследователи также обнаружили новые методы атак.Недавнее исследование OpenAI показывает, что предоставление моделям AI большего времени для обработки информации позволяет им лучше противостоять попыткам манипуляции.
habr.com