MP1框架:机器人学习的新纪元
近日,北京大学的研究团队提出了一种名为MP1的创新机器人学习框架,首次将MeanFlow范式引入机器人学习领域。这一突破性技术此前已在图像生成领域展现出卓越性能,而今为视觉语言动作(VLA)生成模型提供了高效支持。MP1框架通过MeanFlow实现了毫秒级别的快速推理速度,在关键性能指标——速度和成功率方面均达到双SOTA(State of the Art)水平,标志着机器人学习领域的重大进展。
MP1框架MeanFlow机器人学习视觉语言动作双SOTA
2025-07-25
UniVLA架构:跨越视觉、语言和动作的智能融合
北京智源研究院与中国科学院自动化研究所合作,提出了一种名为UniVLA的新型视觉、语言和动作(VLA)模型架构。该架构采用全离散和自回归机制,能够原生地处理视觉、语言及动作信号,并在后训练阶段整合了世界模型,通过分析大规模视频数据学习时序信息和因果逻辑。这种创新设计显著提升了模型在决策任务中的表现和学习效率。
UniVLA架构视觉语言动作全离散模型世界模型因果逻辑
2025-07-10
AI热点
1
2025-11-08
SimKO算法:破解强化学习中的概率过度集中难题



