设计让Agent自主管理记忆(写入与遗忘)的机制,本质上是为其构建一个仿生认知架构(Cognitive Architecture)与分级存储系统。 在上下文中,“遗忘”通常不是物理删除,而是“从当前工作区(Context Window)中驱逐(Evict),归档到长期记忆”;而“写入”则是“提取有价值的信息并持久化”。 以下是实现这一目标的核心机制设计蓝图: --- 一、 核心架构:分级记忆系统 (Tiered Memory) 要实现自主管理,首先需要对记忆进行分级: 1. 工作记忆 (Working Memory): 即当前的Prompt Context,容量有限,包含当前对话和被激活的相关记忆。 2. 短期记忆 (Short-term Memory): 最近N轮的对话历史(通常以滑动窗口形式存在)。 3. 长期记忆 (Long-term Memory): 外部存储(如向量数据库、图数据库),包含语义记忆(事实、知识)和情景记忆(历史事件)。 --- 二、 记忆“写入”机制(When to Write?) Agent如何判断一段信息值得被写入长期记忆?可以通过以下三种维度的机制...