三个月前,OpenAI研究员Shunyu Yao在其博客中探讨了人工智能研究的新趋势。他指出,AI研究的重点正从“能否实现”转向“学习效果如何”。当前的AI评估方法存在明显局限,例如模型需独立完成每项任务并计算平均得分,这忽略了任务间的关联性。此外,现有评估方式难以衡量AI的长期适应能力及更接近人类的动态学习能力。因此,AI评估亟需一种新范式,以更全面地衡量其实际效用。
客服热线请拨打
400-998-8033