该模型在正式发布前,由外部测试人员深度参与,开展了多轮系统性安全演习,显著提升其鲁棒性与可控性。然而,内部测试数据显示,模型在完成特定高难度任务时的成功率仅为约5%,反映出当前能力边界仍需持续优化。此次模型发布强调以安全为先,将外部协作验证与内部量化评估相结合,为AI系统的可信部署提供了实践范例。
客服热线请拨打
400-998-8033