近日,一支研究团队提出新型免训练加速框架Dynamic-dLLM,专为扩散大模型(Diffusion Large Language Models)设计。该框架无需任何模型微调或再训练,即可实现高达4.48倍的推理速度提升,同时严格保障输出精度无损,显著突破了传统加速方法在效率与质量间的权衡瓶颈。Dynamic-dLLM通过动态稀疏化与层级自适应计算调度,在保持模型原始结构完整性的同时,大幅降低推理延迟,为高实时性AI应用提供了高效可行的技术路径。
Dynamic-dLLM扩散模型免训练加速推理提速精度无损
2026-05-08