在自回归视频生成任务中,随着生成时长增加,内容漂移现象日益显著,导致帧稳定性下降乃至生成崩溃。研究发现,该问题并非源于模型容量不足,而常由前序帧噪声水平过低、过于“清晰”所引发——缺乏适度噪声削弱了帧间语义连贯性。关键突破在于引入可控的共享噪声机制:通过在时间维度上统一调控噪声强度,可有效抑制累积误差,显著提升长视频的一致性与鲁棒性。这一发现为解决视频生成中的长期稳定性难题提供了新范式。
客服热线请拨打
400-998-8033