近日,研究人员提出了一种名为MoCa的创新框架,该框架能够将单向视觉语言模型升级为双向多模态嵌入模型。通过持续的预训练和异构对比微调,MoCa显著提升了模型的性能和泛化能力。在一系列多模态基准测试中,MoCa展现了卓越的表现,尤其在小规模模型上的性能提升尤为突出。这一研究为视觉语言模型的发展提供了新的方向。
客服热线请拨打
400-998-8033