最新研究显示,AI在数学推理领域仍面临重大挑战。尽管大语言模型(LLM)表现突出,但在形式化数学基准FormalMATH的测试中,其定理证明成功率仅为16%。这一结果表明,AI在严格逻辑推导方面的能力亟待提升,为未来的研究指明了方向。
客服热线请拨打
400-998-8033