技术博客

模型驱动幻觉检测：利用解释提升性能的新策略

本文介绍了一种在幻觉检测任务中表现卓越的模型，该模型通过引入解释作为训练信号，显著提升了检测性能。实验结果表明，其在多个基准测试中均优于现有的闭源大模型，实现了当前最优的忠实性幻觉检测效果。该方法不仅增强了模型对生成内容真实性的判断能力，也为提升生成式AI的可信度提供了有效路径。

模型幻觉检测解释性能

2026-01-08

神经元角度下幻觉的微观机制探究

研究团队从神经元层面深入探究大模型幻觉的微观机制，发现一类极少数特定神经元——H-神经元，能够有效预测幻觉的发生，并与模型的过度顺从行为显著相关。进一步分析表明，H-神经元的形成根源在于模型的预训练阶段，其异常激活模式在后续推理过程中诱发了非事实性输出。该研究首次从神经元机制角度揭示幻觉的内在动因，为理解大模型的可靠性问题提供了新的理论视角，也为未来设计更具鲁棒性和可解释性的AI系统指明了方向。

神经元幻觉H-神经元预训练大模型

2026-01-06

EvoVLA：机器人幻觉问题的重要突破

北京大学研究团队近日发布了一项名为EvoVLA的新研究成果，旨在解决视觉语言模型（VLA）在长序列任务中频繁出现的“幻觉”问题。该现象表现为机器人误判任务已完成，导致执行失败。EvoVLA通过引入自进化机制，使模型能够在多步操作中持续优化决策过程，显著降低幻觉发生率。实验数据显示，采用EvoVLA框架后，机器人在复杂任务中的成功率提升了10%。尽管具身智能尚未迎来如“ChatGPT时刻”般的突破，但EvoVLA为提升机器人任务可靠性提供了重要技术路径。

EvoVLA机器人幻觉多步进化

2025-12-01

思维链提示：EMNLP 2025中隐匿的双刃剑效应

思维链提示（Chain-of-Thought Prompting）作为提升大语言模型推理能力的重要技术，已被广泛应用于复杂任务中，有效增强了模型回答的逻辑性与准确性，并在一定程度上缓解了幻觉问题。然而，EMNLP 2025的一项最新研究表明，该方法可能带来“双刃剑”效应：尽管推理过程更加连贯，但生成的中间步骤可能掩盖错误假设，导致幻觉更难被检测机制识别。研究发现，在特定任务场景下，使用思维链提示反而使模型自信度上升而准确率停滞，增加了虚假信息传播的风险。这一发现呼吁在应用思维链提示时需同步优化幻觉监测机制，以实现更安全、可靠的语言生成。

思维链双刃剑幻觉提示推理

2025-11-28

深度解析：大型人工智能模型幻觉产生的关键因素

本文系统分析了大型人工智能模型产生幻觉的三大成因：预训练阶段模型依赖统计规律而非事实验证，导致输出偏离真实；后续训练中广泛采用的基于人类反馈的强化学习（RLHF）多使用简单二元评分，难以捕捉复杂语境中的细微差异；现有评估基准未充分认可模型在不确定时“不回答”的合理性。针对上述问题，作者提出一种基于置信度阈值的新评分机制，并引入对错误回答的惩罚规则，使模型在低置信度下选择沉默成为数学最优策略，从而有效抑制幻觉生成。

幻觉预训练RLHF置信度评分

2025-11-28

AI热点

2026-07-05

Router功能被低估：Semantic Router如何革新模型协作

科技热点

Router功能被低估：Semantic Router如何革新模型协作