在ICLR 2025会议上,研究人员提出了一种动态视觉-文本稀疏化框架,该框架成功将多模态大模型(MLLMs)在视觉理解和推理任务中的计算开销降低50%-75%。通过动态稀疏化技术,新框架有效缓解了随着解码阶段生成新token而导致的计算复杂度和GPU显存占用增加的问题,显著提升了模型的推理效率。
客服热线请拨打
400-998-8033