sophnet/Qwen/Qwen-Image-Edit-2509

算能
图片 多模态Qwen2.5-VL 7B指令微调 一致性增强 多图融合 局部重绘 材质替换 几何推理 文本渲染 低延迟 阿里开源

Qwen-Image-Edit-2509 是通义千问团队于 2025 年 9 月发布的图像编辑模型,是 Qwen-Image-Edit 的月度迭代版本。此次更新主要包含三大改进:一是新增了多图编辑能力,支持“人+人”、“人+景”和“人+物”等多种组合,目前在 1 至 3 张输入图片时效果最佳;二是在单图输入时显著增强了一致性,包括更优的人脸身份保持、商品特征保持和文字编辑效果;三是原生支持 ControlNet,可利用深度图、边缘图和关键点图等进行更精细的控制

模型基本信息

输入类型:文本 (自然语言指令)、图像 (支持 1-5 张参考图)、视频 (支持序列帧处理)
输出类型:图像 (PNG, JPEG, WebP)、结构化元数据
上下文长度--
最大输入长度:128K
最大输出长度:--

模型特性

抑制图像偏移 (高稳定性编辑)
人物一致性 (深度保留面部与身份特征)
多人物一致性 (支持多图人物合成与组照融合)
内置 LoRA 适配能力 (兼容多种社区风格)
强化工业设计 (支持批量产品设计与材质替换)
几何推理 (生成设计辅助线与标注)
精准文本渲染 (支持中英文文本编辑与嵌入)

模型价格

计费项价格
输出0.3元 / 每图

调用示意

CURL
查看AppKey