MIT взломал «мозг» LLM: модели научились рассуждать как люди
MIT представил исследование, которое может изменить наше понимание того, как обучаются большие языковые модели. Учёные доказали, что если правильно подать материал, то LLM способны к логическим рассуждениям, а не только к генерации текста по шаблону.Для этого они предложили новый метод обучения — PDDL-INSTRUCT.
Его суть в том, что модель больше не угадывает правильный ответ, а учится пошагово решать задачи с внешней проверкой.Как это работает: 1) Сначала модели показывают правильные и неправильные планы действий с пояснениями.
habr.com