技术博客

华为诺亚实验室MoLE：引领端侧大模型架构革新

在ICML 2025 Spotlight会议上，华为诺亚实验室推出的端侧大模型架构MoLE，通过稀疏激活特性将内存搬运代价降低1000倍。基于Mixture-of-Experts（MoE）原理，MoLE仅在推理时激活每个token所需的一小部分专家，有效减少计算量。然而，尽管MoE优化显著，其参数规模仍大于同等性能的密集型模型，在显存受限的端侧部署中面临挑战。

端侧大模型MoLE架构稀疏激活显存优化推理计算

2025-05-07

AI热点

2025-05-09

开源新篇章：AI在虚拟世界的互动演进

科技热点

开源新篇章：AI在虚拟世界的互动演进