“RAG 三元组”(RAG Triad)是评估检索增强生成(RAG)系统质量的一个核心框架,主要由 TruLens 等评估工具提出并推广。它通过分析 RAG 系统中三个核心组件(提问/Query、上下文/Context、回答/Response)之间的两两关系,来衡量系统的可靠性。 这三个指标分别是: 1. 上下文相关性 (Context Relevance) 2. 真实性/有据性 (Groundedness) 3. 答案相关性 (Answer Relevance) --- 1. 上下文相关性 (Context Relevance) 连接关系: 用户提问 (Query) $\leftrightarrow$ 检索到的上下文 (Context) 核心问题: “检索到的内容跟用户的问题有关系吗?” 详细定义: 衡量检索组件(Retriever)的质量。 它检查检索到的文档块(Chunks)是否包含回答用户问题所需的信息。 如果检索到的内容充满了无关的噪音,LLM 就很难生成正确的答案,或者会因为上下文窗口被无关信息填满而产生幻觉。 低分意味着: 检索系统太差,找回来的都是不相关的信息。 ...