典型的 LLM Agent(大语言模型智能体)架构通常被视为一个以 LLM 为核心大脑,辅以规划(Planning)、记忆(Memory)和工具使用(Tool Use)等模块的综合系统。 目前业界公认最经典的架构参考是 OpenAI 的 Lilian Weng 提出的模型。我们可以将其简化为以下公式: $$Agent = LLM(大脑) + Planning(规划) + Memory(记忆) + Tools(工具)$$ 以下是该架构的详细拆解: --- 1. 核心大脑:LLM (Large Language Model) 这是 Agent 的指挥中心。它不仅仅负责生成文本,更重要的是负责逻辑推理、决策制定和指令分发。 作用:理解用户意图,决定下一步做什么,选择什么工具,以及处理工具返回的结果。 2. 规划模块 (Planning) 如果没有规划,LLM 只是一个问答机器。规划模块让 Agent 具备解决复杂任务的能力。 任务分解 (Sub-goal Decomposition): 将一个宏大的目标(例如“写一个贪吃蛇游戏”)拆解为更小、可执行的步骤(生成代码、编写测试、创建UI)...