ViDoRAG是一种面向视觉丰富文档(Visual-rich Documents)的新型检索增强生成(RAG)范式。该框架创新性地融合GMM多模态混合检索与动态迭代多智能体推理机制,在新构建的基准测试中实现超过10%的性能提升,显著增强了对图文混排、表格嵌套、版式复杂等真实场景文档的理解与生成能力。作为更实用、鲁棒性更强的技术方案,ViDoRAG为多模态信息检索与生成任务提供了重要支撑。
客服热线请拨打
400-998-8033