Исследование MIT: AI не обладает стабильными ценностями, а лишь имитирует их
Исследование стало вирусным несколько месяцев назад, так как предполагало, что по мере того, как AI` становится все более сложным, он разрабатывает «системы ценностей» — системы, которые приводят его, например, к тому, чтобы отдавать приоритет собственному благополучию по сравнению с людьми.
Более поздняя статья из MIT выливает холодную воду на это гиперболическое представление, делая вывод, что AI на самом деле не имеет никаких последовательных ценностей, о которых можно было бы говорить.Соавторы исследования MIT говорят, что их работа предполагает, что «выравнивание» систем AI — то есть обеспечение того, чтобы модели вели себя желаемым, надежным образом — может быть более сложной задачей, чем часто предполагается.
habr.com