陈怡然团队提出了一种全新的零监督训练范式——Vision-Zero,专为视觉语言模型(VLM)设计。该范式采用自博弈框架,充分适应VLM在图像理解与语言生成方面的特性,实现了模型在无需人工标注数据条件下的自我进化。通过构建内部对抗与协作机制,Vision-Zero使模型能够在多轮迭代中不断提升跨模态理解与生成能力,显著降低对大规模标注数据的依赖。实验结果表明,该方法在多个基准任务上表现出优异性能,为VLM的自主学习提供了新路径。
客服热线请拨打
400-998-8033