Исследователи Anthropic обучают языковые модели самосовершенствованию
Исследователи из компании Anthropic разработали новый метод под названием «Максимизация внутренней согласованности» (Internal Coherence Maximization, ICM), который позволяет точно настроить языковые модели, используя только их собственные результаты.
Этот подход может помочь (или даже заменить) человеческий контроль при выполнении сложных задач.Традиционно большие языковые модели дорабатываются с помощью человеческого контроля, например, с помощью примеров ответов или обратной связи.
habr.com