近日,清华大学与墨尔本大学的研究团队共同揭示了开源微调范式中隐藏的安全隐患。研究表明,开源模型在发布前可能被植入后门,这些后门虽不影响模型的一般性能,却可被用于窃取基于该模型微调的下游模型数据。即使攻击者仅拥有黑盒访问权限,仍能利用后门提取敏感信息,对下游模型的数据安全构成威胁。此发现为开源模型的安全性敲响警钟,并呼吁加强相关防护措施。
客服热线请拨打
400-998-8033