一项最新研究提出了AR3D-R1,一种基于自回归架构的文本到3D生成模型,通过强化学习显著提升了3D内容生成的质量与一致性。该模型引入Hi-GRPO——一种层次化强化学习优化方法,通过分离全局结构推理与局部纹理细节的训练过程,增强了生成模型的空间逻辑与视觉表现力。研究同时设计了针对3D生成任务的奖励机制,并构建了全新的评估基准MME-3DR,用于系统衡量模型在隐式推理能力方面的表现。实验表明,AR3D-R1在多维度指标上优于现有方法,为文本驱动3D生成提供了新的技术路径与评估体系。
AR3D-R1强化学习Hi-GRPO3D生成MME-3DR
2025-12-23