在视频推理领域,一项名为“福尔摩斯测试”的挑战正吸引广泛关注。该测试要求多模态大型模型完成高难度任务,如识别视频中的“杀人凶手”或解析“作案意图”。这些任务旨在探索模型在复杂视频推理能力上的极限。目前,相关研究的论文与代码已开源,为全球研究者提供了进一步分析和优化的机会。
客服热线请拨打
400-998-8033