图文混排文档检索新基准:JinaVDR的探索与实践
当前,大多数文档检索基准集(例如 MTEB)主要聚焦于纯文本内容的评估,难以应对包含图表、截图、扫描件及手写标记等视觉复杂元素的文档检索任务。为了推动下一代向量模型和内容重排器的发展,JinaVDR 应运而生,作为一个专注于图文混排文档搜索任务的全新基准集。该基准集旨在评估模型在处理视觉复杂文档方面的能力,填补当前评测体系的空白,助力图文检索技术的进步。
图文检索文档基准视觉复杂向量模型内容重排
2025-08-07
智源BGE-VL:引领多模态模型新篇章
智源BGE-VL是一款由智源与多家顶尖高校联合开发的多模态向量模型。该模型凭借其独特的MegaPairs合成数据技术,在图文检索和组合图像检索等任务中取得了显著进展,刷新了多项基准测试的最高性能记录(SOTA)。这一突破性成果不仅展示了多模态模型的强大潜力,也为相关领域的研究和应用提供了新的方向。
多模态模型智源合作MegaPairs技术图文检索性能记录
2025-03-07
探索智源BGE-VL:多模态向量模型的革命性突破
智源BGE-VL是由智源与多家顶尖高校联合开发的多模态向量模型。该模型凭借创新的MegaPairs合成数据技术,在图文检索和组合图像检索等任务上取得了突破性进展,刷新了当前最佳性能(SOTA)。它在AI检索领域具有革命性意义,能够通过拍照和提问精准搜索,显著提高数据检索的效率和准确性。
智源BGE-VL多模态模型MegaPairs技术图文检索AI搜索
2025-03-07
AI热点
1
2025-11-17
Snowflake AI引领数据工程革新:AI集成的智慧之路



