一窥未来:Sekai视频数据集的革新之旅
近日,上海人工智能实验室联合北京理工大学、上海创智学院及东京大学等机构,推出名为Sekai的高质量视频数据集项目。该项目旨在通过图像、文本或视频构建一个动态且真实的世界,支持用户自由探索。Sekai专注于交互式视频生成、视觉导航与视频理解等任务,计划提供覆盖750个城市的5000小时第一人称视角视频数据,以助力AI更准确地理解和模拟真实世界的动态变化。作为一个持续迭代的数据集,Sekai将面向全球开放,推动人工智能在视频理解与交互领域的技术进步。
人工智能视频数据集交互生成真实世界视觉导航
2025-07-07
‘Sekai’项目:人工智能与高质量视频数据集的融合探索
近日,上海人工智能实验室联合北京理工大学、上海创智学院及东京大学等机构,推出名为“Sekai”的高质量视频数据集项目。该项目旨在服务于交互式视频生成、视觉导航及视频理解等任务,以构建一个动态且真实的世界模型。“Sekai”在日语中意为“世界”,其核心在于通过覆盖750个城市的5000小时第一人称视频,结合图像、文本或视频等多种模态信息,打造一个支持用户自由交互与探索的虚拟环境。
人工智能视频数据集交互生成视觉导航动态世界
2025-07-07
AI热点
1
2025-07-16
美图AI Agent:引领图像设计新浪潮的智能力量