近日,伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合开发出一种新型强化学习算法——PAPO(Perception-Aware Policy Optimization),该技术在多模态推理领域取得突破性进展。通过引入隐式感知损失技术,PAPO算法显著提升了模型的感知能力,使感知错误率降低了30.5%。这一创新不仅增强了模型对信息的识别敏锐度,也为大型模型在复杂任务中的应用提供了新的可能性。
客服热线请拨打
400-998-8033