DeepSeek-R2预计将在5月前发布,作为DeepSeek系列的第三项开源成果。此次发布的DeepGEMM是一个支持稠密和MoE(Mixture of Experts)模型的FP8计算库,适用于V3/R1的训练和推理。DeepGEMM仅用300行代码实现了超越专家级优化内核的性能,展现了DeepSeek团队顶尖的GPU工程师和编译器技术实力,赢得了开发者们的高度赞誉。
客服热线请拨打
400-998-8033