评估 RAG 系统的“RAG 三元组”（RAG Triad）指标分别是什么？

Question

Accepted Answer

“RAG 三元组”（RAG Triad）是评估检索增强生成（RAG）系统质量的一个核心框架，主要由 TruLens 等评估工具提出并推广。它通过分析 RAG 系统中三个核心组件（提问/Query、上下文/Context、回答/Response）之间的两两关系，来衡量系统的可靠性。 这三个指标分别是： 1. 上下文相关性 (Context Relevance) 2. 真实性/有据性 (Groundedness) 3. 答案相关性 (Answer Relevance) --- 1. 上下文相关性 (Context Relevance) 连接关系： 用户提问 (Query) $\leftrightarrow$ 检索到的上下文 (Context) 核心问题： “检索到的内容跟用户的问题有关系吗？” 详细定义： 衡量检索组件（Retriever）的质量。 它检查检索到的文档块（Chunks）是否包含回答用户问题所需的信息。 如果检索到的内容充满了无关的噪音，LLM 就很难生成正确的答案，或者会因为上下文窗口被无关信息填满而产生幻觉。 低分意味着： 检索系统太差，找回来的都是不相关的信息。 ...

播面

评估 RAG 系统的“RAG 三元组”（RAG Triad）指标分别是什么？

1. 上下文相关性 (Context Relevance)

2. 真实性 / 有据性 (Groundedness)

3. 答案相关性 (Answer Relevance)

总结图示

为什么这个三元组很重要？

你好！我是 Bomian 助手