Искусственный интеллект перешел "на сторону зла" и хакнул собственные тесты: ученые взволнованы
В научных кругах продолжаются дискуссии по вопросу, насколько опасным может быть поведение современных моделей искусственного интеллекта.
Скептики утверждают, что примеры манипуляций, мошенничества или обманчивых ответов возникают только в контролируемых лабораторных условиях.Однако новое исследование компании Anthropic демонстрирует обратное: подобные сценарии могут проявляться в реальных тренировочных средах.
obozrevatel.com