360人工智能研究院近期发布了一款名为FG-CLIP的图文跨模态模型。该模型在长文本深度理解和细粒度视觉比对方面实现了显著突破,有效弥补了传统CLIP模型在视觉识别上的不足。FG-CLIP能够更精确地识别图像中的局部细节,为多模态内容的理解与生成提供了新的技术支撑。
客服热线请拨打
400-998-8033