В Google DeepMind будут бороться с «неудержимым» ИИ

habr.com:

В Google DeepMind считают, что вскоре ИИ может начать игнорировать попытки пользователя его остановить. В связи с этим исследователи расширяют области рисков и совершенствуют процесс их оценки.В DeepMind опубликовали третью версию стратегии безопасности на переднем крае (FSF) — комплексного подхода к выявлению и снижению серьёзных рисков, связанных с передовыми моделями ИИ.

Помимо экспертных оценок, при её разработке учли опыт, полученный при внедрении предыдущих версий ИИ.Теперь FSF включает Critical Capability Level (Критический уровень возможностей, CCL), ориентированный на вредоносные манипуляции, в частности, на модели ИИ с такими возможностями, которые могут быть использованы не по назначению для систематического и существенного изменения убеждений.Кроме того, исследователи расширили Framework (Рамочную программу), чтобы учесть потенциальные будущие сценарии, в которых модели ИИ могут помешать операторам изменять, прекращать свою деятельность или управлять ей.

Читать на habr.com Все новости от habr.com

Google опубликовала подробный обзор нового механизма складывания Pixel 10 Pro Fold

Новые правила Google для удалённой работы вызвали путаницу среди сотрудников

1Password и Browserbase будут защищать доступ к учётным данным от ИИ-агентов

В Nvidia будут платить по $100 000 за выдачу виз H-1B для сотрудников

Google опубликовала подробный обзор нового механизма складывания Pixel 10 Pro Fold

Новые правила Google для удалённой работы вызвали путаницу среди сотрудников

1Password и Browserbase будут защищать доступ к учётным данным от ИИ-агентов

В Nvidia будут платить по $100 000 за выдачу виз H-1B для сотрудников

В веб-версии Google Meet появились таймеры

Google заплатит до $30 тысяч за борьбу с «несанкционированными действиями» своих ИИ-ботов

Google DeepMind представила CodeMender — ИИ-агента для автоматического исправления уязвимостей в коде