在多模态大推理模型的研究中,科学家识别出“高熵节点”是诱发幻觉的核心机制——模型在处理过渡词汇(如because、however、wait)时,因语义不确定性激增而偏离图像证据,转向语言先验驱动的想象。为应对该问题,LEAD技术在高熵阶段主动延缓单一输出,在潜在语义空间中并行保留多种推理路径,并通过视觉锚点实时校准,将推理过程锚定于图像证据,显著提升事实一致性与跨模态对齐能力。
客服热线请拨打
400-998-8033