在 Agent(智能体)架构中,“无限循环”通常表现为 Agent 重复执行相同的动作、陷入思维死胡同、或者在两个步骤之间反复横跳。这不仅浪费 Token 成本,还会导致任务失败。 要解决这个问题,需要从系统工程(System Engineering)、提示词工程(Prompt Engineering)和模型策略(Model Strategy)三个层面构建多重防御机制。 以下是具体的解决方案: 1. 系统层面的硬限制(Hard Constraints) 这是最基础的“熔断机制”,用于防止失控。 最大迭代次数(Max Iterations/Steps): 设定一个 Agent 执行任务的最大步数(例如 10 步或 20 步)。一旦达到限制,强制停止并返回当前的最佳结果或错误信息。 代码逻辑示例: 超时机制(Timeouts): 设定整个任务的执行时间上限。 Token 消耗上限: 防止 Agent 在循环中消耗过多的 API 预算。 2. 状态监测与循环检测(State Monitoring) 让系统“意识到”自己正在重复。 历史动作去重(Action Deduplication)...