近日,一项名为“CatAttack”的自动化攻击系统引发了广泛关注。该系统通过攻击者模型(GPT-4o)与代理模型(DeepSeek V3)的协同工作,成功生成了能够干扰大模型逻辑的语句。实验显示,类似“猫咪爱睡觉”这样简单的中文句子,竟可导致大模型逻辑崩溃,揭示了当前人工智能在语言处理方面的潜在脆弱性。这一研究为大模型的安全性提供了新的思考方向。
客服热线请拨打
400-998-8033