近日,大规模形式化数学基准FormalMATH发布,用于评估AI模型在数学推理领域的表现。面对5560道复杂数学难题,当前最先进的AI模型解题成功率仅为16.46%。这一结果揭示了AI在数学推理方面面临的挑战,包括对抽象概念的理解和逻辑推导的局限性。尽管如此,AI在数学推理领域仍展现出巨大潜力,未来的研究或将突破这些限制。
客服热线请拨打
400-998-8033