设计一个带有“断点(Interrupt)”的大模型工作流,本质上是实现一个 Human-in-the-Loop (HITL,人类在环) 系统。在这个系统中,大模型本身并不具备真正的“暂停”能力,而是通过外围的工程架构与状态机(State Machine)来拦截敏感操作的执行。 以下是设计这样一个工作流的完整指南,包括架构设计、实现路径(以主流框架为例)以及工程最佳实践。 --- 一、 核心架构设计 整个系统可以分为四个阶段:意图识别与规划 -> 拦截与挂起 -> 人类审批 -> 恢复与执行。 1. AI 规划层: LLM 接收用户指令,决定需要调用工具(Function Calling)。 2. 网关拦截层(核心): 系统检查 LLM 请求调用的工具名。如果属于“敏感工具名单”(如 , ),则拦截执行。 3. 状态挂起层: 将当前会话的完整上下文(消息历史、准备调用的工具及参数)序列化并持久化保存到数据库(如 Redis、PostgreSQL),释放计算资源,不让程序死等。 4. 异步审批层: 通过 Webhook 发送通知给人类审批者(通过钉钉、企业微信、邮件或内部工单后台)。...