探讨ScholarSearch项目:语言模型在科研助手角色中的表现
近日,北京大学推出了名为ScholarSearch的学术搜索评估项目,旨在评估大型语言模型(LLMs)在科研助手角色中的表现。该项目通过模拟“开卷考试”的方式,对DeepResearch等深度研究工具提出了挑战。初步测试结果显示,尽管这些模型在多个领域展现出潜力,但目前尚无任何模型能够完全满足科研工作对准确性与深度的严格要求。ScholarSearch的推出不仅揭示了当前技术的局限性,也为未来科研辅助工具的发展提供了重要参考。
ScholarSearch学术搜索科研助手语言模型开卷考试
2025-06-27
AMD与约翰·霍普金斯大学联手,AI科研助手开源助力学术创新
AMD与约翰·霍普金斯大学携手,共同开发并开源了科研领域的人工智能助手——Agent Laboratory。这款AI科研助手旨在辅助科研人员高效撰写学术论文,通过自动化流程节省时间,提升研究效率。这一创新工具不仅为科研工作者提供了强有力的支持,还促进了科研成果的快速产出和分享。
AMD合作开源AI科研助手论文撰写自动化流程
2025-02-12
AI热点
1
2025-07-16
上海人工智能实验室的新突破:OmniDocBench多源文档解析评测框架详解