在2025年ICLR会议上,由多个研究机构联合提出的ColPali模型与ViDoRe基准测试引发广泛关注。该方案创新性地通过直接从文档图像生成嵌入向量,实现了文本与视觉信息的有效整合,突破了传统多模态检索中依赖OCR解析的局限。ColPali不仅简化了信息检索流程,还在多项性能指标上显著优于现有方法。ViDoRe作为配套的评估基准,为文档理解任务提供了标准化测试平台,推动了文档智能领域的发展。
客服热线请拨打
400-998-8033