本文介绍了一种名为Manual2Skill的创新机器人学习框架,该框架由新加坡国立大学邵林团队开发。通过运用视觉语言模型(VLMs),Manual2Skill能够解析人工设计的视觉说明书,帮助机器人自主完成复杂的家具装配任务。其核心技术包括层级化图式指令解析和鲁棒位姿估计,有效弥合了抽象说明书与实际物理操作之间的差距。
客服热线请拨打
400-998-8033