在AAAI 2026会议上,研究团队对23款主流视频大语言模型进行了全面评估。结果显示,这些模型在处理动态视觉信息与理解多模态数据方面展现出显著能力,已成为现实世界中应对复杂数据的关键技术。然而,尽管其在语义理解与跨模态推理上取得进展,模型在真实性、安全性、公平性、鲁棒性以及隐私保护等方面仍存在明显短板,暴露出在实际应用中的潜在风险。未来需进一步加强算法优化与伦理规范研究,以提升系统的可靠性与社会适应性。
客服热线请拨打
400-998-8033