针对CVPR 2025的研究聚焦于大型视觉语言模型(LVLMs)中存在的物体幻觉问题,即模型可能错误地描述图像中并不存在的物体,影响了其可靠性与实用性。为解决这一问题,研究提出了一种基于零空间投影的方法,旨在挖掘正常样本的特征,从而在不增加额外计算成本的前提下,实现图像幻觉的有效消除。该方法通过分析特征空间中的冗余信息,将潜在的幻觉特征映射到零空间中,显著提升了模型的生成准确性和鲁棒性。实验结果表明,该方法在多个基准数据集上均表现出优异的性能,为未来LVLMs的发展提供了新的思路和方向。
客服热线请拨打
400-998-8033