近期,一研究团队提出Goal-VLA——一种新型解耦式分层框架,旨在将生成式大模型转化为具备环境理解与规划能力的“世界模型”。该框架通过目标驱动的视觉-语言-动作联合建模,实现对机器人操作任务的零样本泛化,无需针对具体任务进行微调或真实数据训练。其分层设计分离了高层语义推理与底层运动控制,显著提升了跨场景、跨任务的适应性与可解释性,为通用具身智能提供了新范式。
客服热线请拨打
400-998-8033