sophnet/Qwen/Qwen-Image-Edit-2509

算能

图片多模态Qwen2.5-VL 7B指令微调一致性增强多图融合局部重绘材质替换几何推理文本渲染低延迟阿里开源

Qwen-Image-Edit-2509 是通义千问团队于 2025 年 9 月发布的图像编辑模型，是 Qwen-Image-Edit 的月度迭代版本。此次更新主要包含三大改进：一是新增了多图编辑能力，支持“人+人”、“人+景”和“人+物”等多种组合，目前在 1 至 3 张输入图片时效果最佳；二是在单图输入时显著增强了一致性，包括更优的人脸身份保持、商品特征保持和文字编辑效果；三是原生支持 ControlNet，可利用深度图、边缘图和关键点图等进行更精细的控制

模型基本信息

输入类型：文本 (自然语言指令)、图像 (支持 1-5 张参考图)、视频 (支持序列帧处理)

输出类型：图像 (PNG, JPEG, WebP)、结构化元数据

上下文长度--

最大输入长度：128K

最大输出长度：--

模型特性

抑制图像偏移 (高稳定性编辑)

人物一致性 (深度保留面部与身份特征)

多人物一致性 (支持多图人物合成与组照融合)

内置 LoRA 适配能力 (兼容多种社区风格)

强化工业设计 (支持批量产品设计与材质替换)

几何推理 (生成设计辅助线与标注)

精准文本渲染 (支持中英文文本编辑与嵌入)

模型价格

计费项	价格
输出	0.3元 / 每图

调用示意

CURL

查看AppKey