谢赛宁团队近期提出了创新的多模态架构BLIP3-o,该模型融合了自回归与扩散模型的优势。通过CLIP特征驱动的方法,BLIP3-o为图像理解与生成领域提供了全新范式。论文首次深入探讨了混合自回归和扩散架构在统一多模态建模中的潜力,并针对三大关键领域进行了系统评估,展现了其在多模态任务中的卓越性能。
客服热线请拨打
400-998-8033