“Lost in the Middle”(中间丢失) 现象是大语言模型(LLM)在处理长文本上下文时表现出的一种显著缺陷。 简单来说,当给模型输入很长的文本(Context)时,模型往往能很好地利用开头和结尾的信息,但容易忽略或“忘记”位于文本中间的信息。 以下是关于这一现象的详细解释以及在 Prompt Engineering(提示词工程)中的应对策略。 --- 一、 什么是“Lost in the Middle”? 这一现象最早由斯坦福大学、加州大学伯克利分校等机构的研究人员在 2023 年的论文中系统提出。 1. 核心表现:U 型曲线 模型的性能通常呈现出一种 U 型曲线: 首因效应 (Primacy Effect): 当关键信息位于 Prompt 的最开头时,模型提取效果很好。 近因效应 (Recency Effect): 当关键信息位于 Prompt 的最末尾时,模型提取效果也很好。 中间低谷: 当关键信息被埋藏在长文本的中间位置时,模型的准确率会显著下降。 2. 为什么会发生? 注意力机制(Attention Mechanism): 虽然 Transformer 架构...