Как научить ИИ-агентов лучше планировать задачи с помощью мета-плана?
Языковые модели (LLM) уже умеют решать сложные задачи, но их способность к планированию остается несовершенной. Исследователи из Пекинского университета представили новый метод MPO (Meta Plan Optimization), который помогает LLM-агентам эффективнее выполнять многошаговые задачи.MPO — это подход, который улучшает планирование действий ИИ-агентов за счет использования мета-планов.
Эти планы представляют собой высокоуровневые стратегии выполнения задач, которые абстрагированы от конкретных деталей среды.
habr.com