北京航空航天大学研究团队近期发布了一款名为TinyLLaVA-Video-R1的小型视频推理模型。该模型以紧凑的结构在通用视频问答数据集上表现出色,能够重现人类理解复杂信息时的“顿悟时刻”。值得一提的是,TinyLLaVA-Video-R1已完全开源,其模型权重、源代码及训练数据集均向公众开放,为全球研究者和开发者提供了便利条件。
客服热线请拨打
400-998-8033