Исследование по повышению производительности в системах RAG
Исследователи из Еврейского университета в Иерусалиме обнаружили, что количество документов, обработанных с помощью технологии расширенной генерации поиска (RAG), влияет на производительность языковой модели, даже если общая длина текста остается постоянной.Исследовательская группа использовала набор данных проверки MuSiQue, содержащий 2417 вопросов с ответами.
Каждый вопрос ссылается на 20 абзацев Википедии, при этом два-четыре абзаца содержат релевантную информацию об ответе, а остальные служат реалистичными отвлекающими факторами.Чтобы изучить, как количество документов влияет на производительность, исследователи создали несколько разделов данных.
habr.com