在 LangGraph 中处理大模型 API 调用时的超时或异常(Exception),最佳实践是分层处理。你可以根据具体的业务需求,在 模型层(LLM级别)、节点层(Node级别) 或 图路由层(Graph级别) 来设计重试和错误捕获机制。 以下是具体的 4 种设计方案,按照从简单到复杂的顺序排列: --- 方案一:使用 LangGraph 原生的节点重试机制(推荐) LangGraph 原生支持为具体的 Node 配置 。这是最推荐的方式,因为它能在图引擎级别统一管理,并且对可观测性(如 LangSmith)非常友好。 适用场景: 处理偶发的网络抖动、API 限流(Rate Limit)或超时。 --- 方案二:使用 LangChain 模型自带的重试和超时参数 在调用底层大模型时,LangChain 的 ChatModels 本身就封装了基于 库的重试机制,并支持设置超时时间。 适用场景: 最简单的 API 兜底,不需要复杂的图逻辑介入。 --- 方案三:Node 内部的 Try-Except + State 状态记录(错误降级) 如果重试了依然失败,或者你想根据不同的错误...