本研究提出了一种名为SEARCH-R1的创新强化学习框架,旨在显著提升大型语言模型(LLM)在多轮搜索与推理方面的能力。不同于传统的检索增强生成(RAG)或工具使用方法,SEARCH-R1通过强化学习技术,使LLM能够自主生成查询语句,并优化其对搜索引擎结果的推理过程,从而实现更高效、精准的信息处理。
客服热线请拨打
400-998-8033