当前,具身智能领域的Vision-Language-Action(VLA)技术正深陷“碎片化”困境:不同研究团队采用差异显著的动作解码范式、互不兼容的数据管线及各自为政的评测协议,致使模型性能难以横向比较、实验结果难以复现,显著抬高了研发与验证成本。这一结构性挑战正制约VLA技术从实验室走向系统化演进与规模化应用。
客服热线请拨打
400-998-8033