在复杂的文档问答(Document Q&A)场景中,多跳推理(Multi-hop Reasoning) 指的是系统无法直接从单个文本片段中找到答案,而是需要跨越多个段落、多个文档,甚至结合不同的信息源,经过逻辑推导才能得出结论的过程。 传统的简单 RAG(检索增强生成)通常只进行一次检索(Retrieve)然后生成(Generate),这在面对多跳问题时往往会失败,因为答案的线索分散在不同位置。 Agent 通过引入规划(Planning)、工具使用(Tool Use)和记忆(Memory)机制来解决这个问题。以下是 Agent 处理多跳推理的核心策略和架构: --- 1. 问题分解(Query Decomposition / Sub-questioning) 这是最基础也是最有效的策略。Agent 不直接回答复杂问题,而是将其拆解为一系列简单的子问题。 工作原理: 1. Agent 接收复杂查询(例如:“对比 A 公司和 B 公司在 2023 年的营收增长率,并说明谁更高”)。 2. LLM 分析问题,生成子问题列表: 子问题 1:A 公司 2022 和 2023 年的营收是多...