一项前沿研究提出了一种新型扩散模型训练框架,创新性地融合FP4与BF16两种数值精度策略:以FP4进行高效初步探索,再切换至BF16开展高保真训练。该方法在维持等效奖励水平的前提下,显著提升收敛速度,最高可达4.64倍加速。相较于传统全精度或单一低精度训练方案,该框架在训练效率与模型对齐效果之间实现了更具工程可行性的平衡,为大规模生成式AI模型的落地应用提供了新路径。
客服热线请拨打
400-998-8033