剑桥大学与谷歌携手开展的新研究揭示,通过运用GRPO(基于梯度的后训练优化正则化框架),大型视觉模型在视觉导航任务中的表现显著提升。数据显示,推理准确率提高了80%,远超传统文本推理方法,展现出卓越性能。
客服热线请拨打
400-998-8033