近日,由香港中文大学MMLab、快手可灵及清华大学等机构联合提出的一项创新研究,首次将在线强化学习技术GRPO引入流匹配模型,开发出Flow-GRPO模型。该模型显著提升了GenEval性能,接近满分水平,并在组合生成图像方面超越了GPT-4o。这一成果标志着在线强化学习在流匹配模型领域的首次成功应用,为未来生成式人工智能技术的发展开辟了新路径。
客服热线请拨打
400-998-8033