北京大学近期研发出一种名为ReMoMask的先进Text-to-Motion框架,旨在生成高质量的3D游戏动作。该框架集成了三项创新技术:首先,采用基于动量的双向文本-动作模型,通过动量队列技术提升跨模态检索的精确度;其次,引入语义时空注意力机制,在部件级融合时强制执行生物力学约束,消除异步伪影;最后,结合RAG-无分类器引导和轻微的无条件生成,增强模型的泛化能力。ReMoMask为3D游戏开发提供了高效、精准的动作生成解决方案。
ReMoMask文本动作3D游戏跨模态检索语义时空
2025-08-09