SceneSplat是一种基于3DGS(3D场景图)的创新场景理解和视觉语言预训练技术,旨在使3D高斯模型能够理解人类语言指令,从而实现对3D场景的端到端语义学习。与大多数依赖2D图像或文本信息进行训练或推理的方法不同,SceneSplat通过开放词汇识别与分类技术,能够更全面地理解现实世界的3D场景,突破了传统方法在3D数据处理能力上的限制。作为视觉任务中3D场景表达的重要标准之一,3DGS为SceneSplat提供了坚实的基础,推动了3D场景理解和视觉语言预训练领域的发展。
客服热线请拨打
400-998-8033