RAGの誤回答は「検索の失敗」か「生成の失敗」か — 原因を診断してから直す軽量フレームワーク「D2R-RAG」
DRANK

6月30日、Soroush Hashemifar らが「Diagnosing and Repairing Factual Errors in RAG under Budget Constraints」と題した論文を公開した。予算制約のある実運用環境でRAGの事実誤りを診断・修正するモデル非依存フレームワーク「D2R-RAG」を提案する内容で、「まず原因を診断し、原因に応じた最小コストのアクションを取る」という設計思想が核心にある。

by @tf_official
Related Topics: Apache HTTP Server Machine Learning Deep Learning