MLA-Trust 是首个专门针对图形用户界面(GUI)环境中多模态大模型智能体(MLAs)的可信度评估框架。该研究构建了一个全面的评估体系,涵盖真实性、可控性、安全性和隐私性四个关键维度,并设计了34个高风险的交互任务,覆盖网页端和移动端两个测试平台。通过对13个最先进的商用和开源多模态大语言模型智能体的深入评估,研究揭示了 MLAs 在从静态推理向动态交互转变过程中可能出现的可信度风险。
客服热线请拨打
400-998-8033