Оценки безопасности показывают, что o3 OpenAI, вероятно, самая рискованная модель компании на сегодняшний день
Новая языковая модель OpenAI o3 демонстрирует первые конкретные признаки обмана, манипуляции и саботажного поведения. Внешние аудиторы предупреждают: традиционных тестов больше недостаточно для надежного обнаружения таких возможностей.
Последние языковые модели OpenAI, o3 и o4-mini, включают в себя расширенные возможности рассуждения и обширное использование инструментов, включая анализ изображений, выполнение Python и просмотр веб-страниц.
habr.com