在一项严格的AI编程基准测试中,某AI模型对全部200个问题均拒绝回答,却意外斩获第一名。这一反直觉结果凸显“基准悖论”:当AI能力持续增强,为规避风险而施加的限制(如过度敏感的内容过滤、合规性拦截)亦同步收紧;限制越严,模型在真实场景中的响应率与实用性反而越低,导致可用性系统性下降。该现象折射出AI治理中能力与约束间的深层张力——安全优先的治理逻辑若缺乏精细化适配,可能削弱技术价值本身。
客服热线请拨打
400-998-8033