一项由全球50个国家顶尖学者联合研发的人工智能测试集HLE(Human-Level Evaluation)正式发布,旨在系统性探索机器智能的真实能力边界。该测试集突破传统基准局限,聚焦推理、常识理解、跨文化语境适应等高阶认知维度,力图回答“AI的真正极限何在”这一根本性命题。HLE不仅体现国际学术协作的广度与深度,更标志着人工智能评估从单项性能向综合智能跃迁的重要一步。
客服热线请拨打
400-998-8033