香港中文大学与清华大学的研究团队在视频推理领域取得重大突破,推出Video-R1模型。该模型首次将强化学习的R1范式应用于视频推理任务,通过改进的T-GRPO算法及图像与视频数据集的结合,显著提升视频空间推理性能,超越GPT-4o模型。为推动研究发展,其代码与数据集已全面开源。
客服热线请拨打
400-998-8033