DeepSeek 近日发布一次重要更新,核心聚焦于底层计算引擎的性能升级,而非模型架构本身。此次更新引入两项关键技术:Mega MoE(大规模混合专家)调度机制与 FP4 Indexer(4位浮点索引器),显著提升稀疏推理效率与显存带宽利用率。所有优化均基于对 DeepGEMM 代码库的深度重构,涵盖矩阵乘法内核、内存访问模式及量化索引逻辑等关键模块。官方明确强调,本次更新“与模型无关”,意味着现有各类 DeepSeek 模型(如 DeepSeek-V2、DeepSeek-Coder 等)均可无缝受益于该底层加速能力。
DeepSeek更新Mega MoEFP4 IndexerDeepGEMM优化模型无关
2026-04-17