传统的 RAG（检索增强生成）与 Agentic RAG（代理式 RAG）有什么区别？

知识点图片

这是一个非常好的问题。随着大模型应用的发展，RAG（检索增强生成）已经从简单的线性流程进化到了更复杂的代理式（Agentic）架构。

简单来说：

以下是详细的对比分析：

传统的 RAG 通常是一个固定的流水线（Pipeline）。

工作流程：
1. 用户提问： 用户输入 Query。
2. 检索 (Retrieve)： 系统在向量数据库中查找与 Query 相似的文档片段。
3. 增强 (Augment)： 将检索到的片段和用户的 Query 拼接到一起，形成 Prompt。
4. 生成 (Generate)： LLM 根据 Prompt 生成答案。
特点：
- 一次性 (One-shot)： 只有一次检索和一次生成的机会。
- 盲目信任： LLM 必须基于检索到的内容回答，如果检索到的内容是错的或不相关的，LLM 往往也会胡说八道（或者回答“不知道”）。
- 无推理规划： 系统不会拆解复杂问题，只是简单地进行语义匹配。

比喻： 就像你问图书管理员一个问题，他根据关键词给你找了几页书，然后让你必须立刻根据这几页书写出答案，不允许你再去查别的资料。

Agentic RAG 将 LLM 视为一个智能体（Agent），也就是一个拥有“大脑”的决策者，而不仅仅是一个文本生成器。

工作流程（动态循环）：
1. 理解与规划： Agent 接收问题，分析是否需要检索？需要检索什么？是否需要拆解问题？
2. 工具调用： Agent 决定调用“检索工具”（可能是向量库，也可能是 Google 搜索，甚至是计算器）。
3. 多步推理 (Multi-hop)： 针对复杂问题，Agent 可能先查 A，根据 A 的结果再去查 B。
4. 自我反思 (Reflection/Critique)： Agent 会检查检索到的内容是否足以回答问题。如果不够，它会修改搜索词重新检索。
5. 最终生成： 当 Agent 认为信息充足时，才会整合信息生成最终答案。
特点：
- 自主性 (Autonomy)： LLM 决定流程的走向，而不是硬编码的代码。
- 纠错能力： 能够识别“检索失败”并尝试补救。
- 工具使用： 可以连接多个数据源或外部 API。

比喻： 就像你把问题交给一个研究助理。他会先去查资料，读完发现资料不够，又换了个关键词去查，顺便用计算器算了个数据，最后把所有信息汇总整理好交给你。

为了让你更具体地理解 Agentic RAG，这里有几种常见的实现模式：

路由 (Routing)：
Agent 分析用户的问题，决定是去查“技术文档库”，还是查“销售数据库”，或者是直接用自己的通用知识回答（不需要 RAG）。
查询重写 (Query Rewriting)：
用户的问题可能很模糊。Agent 不会直接拿去搜，而是先将问题改写成更适合检索的形式，甚至生成多个不同角度的查询词。
Self-RAG (自我修正 RAG)：
模型在生成答案的同时，会生成特殊的 Token 来自我评价：检索的内容相关吗？生成的答案忠实于原文吗？如果不相关，就触发重新检索。
ReAct (Reasoning + Acting)：
经典的 Agent 模式。模型先“思考”下一步该做什么，然后“行动”（调用检索工具），观察结果，再进行下一轮思考。

播面