在ICML 2025 Spotlight会议上,一项研究提出了EMMA基准测试,用于评估多模态大型语言模型(MLLMs)的深度视觉与文本融合能力。研究表明,即使是最先进的MLLMs,在复杂推理方面仍存在显著不足。EMMA基准测试揭示了这些模型在多模态推理中的短板,为未来的研究提供了重要参考。
客服热线请拨打
400-998-8033