本文介绍了一种名为TempR1的新型方法,该方法基于时序感知多任务强化学习框架,显著增强多模态大模型在视频时序理解任务中的推理能力。TempR1在五大主流时序理解任务上均取得领先性能,展现出优异的泛化性与可扩展性,为长视频场景下的细粒度时序推理提供了新范式。
客服热线请拨打
400-998-8033