近日,北京大学DS-Lab团队推出了一款全新的学术信息检索评估工具——ScholarSearch。该数据集包含223个高难度的学术搜索问题及其对应答案,专为全面测试大型语言模型在复杂学术信息处理中的能力而设计。通过这一创新工具,研究者可以更精准地衡量和提升语言模型在学术领域的表现。
客服热线请拨打
400-998-8033