阿里最新推出的人工智能模型在多项测试中表现出色,性能全面超越GPT5,在通用知识、数学推理、编程任务以及综合任务方面均展现出更强的能力。此外,该模型在情商表现上也优于GPT5,能够理解诸如“下棋大爷在雨中坚持4小时”的情感与坚持。对比测试还显示,其性能优于Claude-Opus 4(Non-Thinking)、Kimi-K2、DeepSeek-V3.1以及阿里此前开源的最佳模型Qwen3-235B-A22B-Instruct-2507。然而,测试中也揭示了该模型存在一个尚未解决的潜在问题,有待进一步优化。