Новый метод адаптирует языковые модели без обучения
Исследователи из Sakana AI представили метод Text-to-LoRA (T2L), который адаптирует большие языковые модели к новым задачам, используя только простое текстовое описание — никаких дополнительных обучающих данных не требуется.Большие языковые модели обычно специализируются с помощью таких методов, как LoRA (адаптация с низким рангом).
LoRA работает путём вставки небольших матриц с низким рангом в определённые слои модели, что делает процесс адаптации гораздо более эффективным, чем полная тонкая настройка.
habr.com