在多跳问答(Multi-hop QA)场景下,传统的“一次检索+一次生成”的朴素 RAG(Naive RAG)往往会失效,因为答案分散在不同的文档中,且文档之间存在逻辑关联(例如:文档 A 包含线索,指向文档 B,文档 B 包含最终答案)。 设计一个能够处理多跳问题的 RAG 系统,核心在于将推理(Reasoning)与检索(Retrieval)交织在一起。以下是针对多跳 QA 场景的 RAG 系统设计方案,分为架构模式、关键模块设计和优化策略三个部分。 --- 一、 核心架构模式 针对多跳问题,主要有三种主流的架构设计思路: 1. 迭代检索 (Iterative Retrieval) 这是最直观的方法。系统通过多次检索循环来逐步逼近答案。 流程: 1. LLM 基于原始问题生成一个初始检索 Query。 2. 检索 Top-K 文档。 3. LLM 阅读检索到的文档,判断信息是否足够回答原始问题。 4. 如果不够,LLM 基于当前获得的上下文(Context),生成下一个检索 Query。 5. 重复上述步骤,直到收集齐所有信息。 优点: 灵活,不需要复杂的预处理。 缺点: 延...