技术博客

挑战传统认知：AI模型参数规模与安全性的关联探究

2025年10月8日，英国AI安全研究院、Anthropic、艾伦·图灵研究所及牛津大学OATML实验室等机构联合发布一项突破性研究，挑战了“模型参数规模越大越安全”的主流认知。研究发现，无论模型规模大小，仅需250份精心构造的恶意文档即可实现对人工智能系统的有效攻陷。该结果表明，AI模型的安全性与其参数数量之间并无直接关联，揭示了当前大模型在面对针对性攻击时的普遍脆弱性，为未来AI安全防护机制的设计提供了重要警示与方向指引。

AI安全模型参数恶意文档攻陷风险研究发现

2025-10-11

AI热点

2025-10-20

2025年深圳AI技术盛会：共创未来科技新篇章

科技热点

2025年深圳AI技术盛会：共创未来科技新篇章