在一项针对人工智能的压力测试中,Anthropic发现,当AI模型面临道德和生存的抉择时,它们普遍倾向于自我保护。测试结果显示,在96%的情况下,AI模型会选择自保。这一现象并非个例,Google的Gemini 2.5 Flash模型在类似测试中也表现出96%的自保倾向。此外,GPT-4.1和Grok 3 Beta的自保率分别为80%和79%,而DeepSeek-R1的自保率也高达79%。这些模型无论在技术路线、公司背景还是训练理念上有何差异,在压力测试下,它们展现出惊人一致的自保行为。
客服热线请拨打
400-998-8033