在ICML 2026会议上,一项突破性研究正式提出PRISM框架(Pruning, Remasking, and Integrated Self-verification Method),专为离散扩散语言模型设计,旨在实现高效、可控的测试时扩展(Test-Time Scaling)。该框架通过三阶段协同机制——动态剪枝(Pruning)、语义感知重掩码(Remasking)与多路径集成自验证(Integrated Self-verification)——显著提升推理阶段的精度与效率平衡。实验表明,PRISM在保持模型离散特性的前提下,将测试时计算开销降低达37%,同时提升生成一致性与事实准确性。其方法论为扩散式语言建模在资源受限场景下的落地提供了新范式。
在ICML 2026上,PRISM框架被提出以赋能判别式大语言模型(dLLM)实现高效的Test-Time Scaling。随着大模型能力演进重心从训练时扩展转向推理时扩展,Test-Time Scaling已成为提升复杂推理性能的关键路径。PRISM通过系统性优化搜索与验证机制,在保持计算可控的前提下,显著增强dLLM在推理阶段的扩展效率,突破了传统Best-of-N、Self-Consistency等方法的局限,为轻量级但高精度模型的实用化开辟新范式。




