字节跳动公司近期在AI视频生成领域取得重大突破,提出了一种名为Phantom的新方法。该方法通过跨模态对齐技术,基于文本、图像和视频三元组学习,实现了主体一致的高质量视频生成。Phantom重新设计了联合文本-图像注入机制,并引入动态特征集成技术,在单/多主体视频生成及人脸ID保持任务中表现出色,其性能在定量评估中超越了现有商业级解决方案。
客服热线请拨打
400-998-8033