近日,伯克利大学与英伟达联合发布了一项突破性成果——PS3视觉编码器。该技术首次实现了无需额外成本的4K分辨率视觉预训练。同时,双方还推出了多模态大型模型VILA-HD,在多模态任务中达到全新最佳性能(SOTA),其处理速度较现有技术提升了三倍,为人工智能领域带来了显著进步。
客服热线请拨打
400-998-8033