微软与Salesforce Research合作的研究《Lost in Conversation》显示,顶尖大型语言模型(LLM)在多轮对话中的表现平均下降39%,这一现象被称为“迷失”。研究对比了Claude 3.7-Sonnet、Deepseek-R1等多个模型,分析其“迷失”原因,并探讨缓解策略,旨在提升模型在复杂对话场景下的稳定性与准确性。
客服热线请拨打
400-998-8033