技术博客

揭示大型语言模型中自注意力模块的极大值现象

在即将到来的ICML 2025会议上，一项突破性研究《Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding》揭示了大型语言模型（LLMs）中自注意力模块的极大值现象。研究表明，这些极大值对上下文知识的理解起着关键作用，为优化LLMs性能提供了新方向。

自注意力模块上下文知识极大值现象大型语言模型ICML 2025会议

2025-05-07

AI热点

2025-05-09

开源新篇章：AI在虚拟世界的互动演进

科技热点

开源新篇章：AI在虚拟世界的互动演进