最新发布的科研基准旨在通过一系列复杂的科学问题,从物理、化学与生物三个维度全面评估AI的推理与创新能力。该基准涵盖开放性问题与多步骤推演任务,模拟真实科研场景。研究结果显示,尽管AI在数据整合与模式识别方面表现优异,能够处理跨学科复杂问题,但在提出原创性假设、设计实验路径及解释不确定结果等方面,仍显著落后于人类科学家。尤其在缺乏标准答案的探索性任务中,AI的局限性更为明显,暴露出其在深层科学推理和创造性思维上的不足。
客服热线请拨打
400-998-8033