近期,一项针对大型语言模型(LLM)的高等数学测试结果显示,这些模型在复杂数学问题上的表现令人瞩目。测试中,GPT-4o和Mistral AI等模型平均得分高达90.4分(满分100分)。它们在向量计算、几何分析及积分计算等领域几乎无误。研究指出,通过适当的提示优化(Re-Prompting),可显著提升模型解题准确率,为未来AI技术发展提供了新方向。
客服热线请拨打
400-998-8033