当前,大多数文档检索基准集(例如 MTEB)主要聚焦于纯文本内容的评估,难以应对包含图表、截图、扫描件及手写标记等视觉复杂元素的文档检索任务。为了推动下一代向量模型和内容重排器的发展,JinaVDR 应运而生,作为一个专注于图文混排文档搜索任务的全新基准集。该基准集旨在评估模型在处理视觉复杂文档方面的能力,填补当前评测体系的空白,助力图文检索技术的进步。
客服热线请拨打
400-998-8033