在ICML 2026会议上,一项聚焦大型语言模型(LLM)算术能力的机制可解释性研究揭示:LLM在处理多操作数加法任务时,其内部算术状态并非随机激活,而是组织为高度结构化的几何流形。该发现突破了传统黑箱分析范式,为定位与归因算术错误提供了可量化的几何依据。研究证实,错误并非源于局部神经元失活,而常对应于流形结构的局部畸变或跨流形跃迁失效。
客服热线请拨打
400-998-8033