港中文与清华大学联合团队实现视频推理领域重大突破
港中文与清华大学联合团队在视频推理领域取得突破性进展,开发出首个应用强化学习R1范式的Video-R1模型。该模型通过改进的T-GRPO算法及图像与视频数据集的结合,在视频空间推理测试中超越了GPT-4o,展现出卓越的推理能力。此外,Video-R1已开源所有代码和数据集,助力学术与工业界的进一步研究。
视频推理强化学习Video-R1T-GRPO算法开源数据集
2025-04-16
Video-R1模型:视频推理领域的突破性进展
香港中文大学与清华大学的研究团队在视频推理领域取得重大突破,推出Video-R1模型。该模型首次将强化学习的R1范式应用于视频推理任务,通过改进的T-GRPO算法及图像与视频数据集的结合,显著提升视频空间推理性能,超越GPT-4o模型。为推动研究发展,其代码与数据集已全面开源。
视频推理强化学习Video-R1模型T-GRPO算法开源代码
2025-04-16
AI热点
1
2025-08-13
面试致胜:破解刷题误区,展现实际能力