全能图像编辑 AI 模型 Qwen-Image-Edit 发布,哪里不对改哪里(全能画图板p图)

8 月 19 日消息,『通义千问』 Qwen 今日宣布推出 Qwen-Image-Edit—— Qwen-Image 的图像编辑版本。

Qwen-Image-Edit 基于 20B 的 Qwen-Image 模型进⼀步训练,成功将 Qwen-Image 的独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑

此外,Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),从而兼具语义与外观的双重编辑能力。用户可以访问 Qwen Chat (chat.qwen.ai)并选择“图像编辑”功能进行体验。

Qwen-Image-Edit 的主要特性包括:

  • 语义与外观双重编辑:Qwen-Image-Edit 不仅⽀持 low-level 的视觉外观编辑(如元素的添加、删除、修改等,要求图片其他区域完全不变),也支持 high-level 的视觉语义编辑(如 IP 创作、物体旋转、风格迁移等,允许整体像素变化但保持语义一致)。
  • 精准文字编辑:Qwen-Image-Edit 支持中英文双语文字编辑,可在保留原有字体、字号、风格的前提下,直接对图片中的文字进行增、删、改等操作。
  • 强大的基准性能:在多个公开基准测试中的评估表明,Qwen-Image-Edit 在图像编辑任务上具备 SOTA 性能,是一个强大的图像编辑基础模型。

Qwen-Image-Edit 的一大亮点在于其语义与外观双重编辑能力。所谓语义编辑,是指在保持原始图像视觉语义不变的前提下,对图像内容进行修改。 附示例如下:

原创 IP 编辑

官方以 Qwen 的吉祥物 —— 卡皮巴拉为例,来直观展示这一能力:

可以看到,虽然编辑后的图像大多数像素与输入图像(最左侧的图)都不一样,但依然完美地保持了卡皮巴拉的角色一致性。Qwen-Image 的语义编辑能力使其能够进行原创 IP 的多样化创作。

更进一步的,官方在 Qwen Chat 上围绕 MBTI 十六型人格,设计了一系列编辑 prompt,成功地基于吉祥物卡皮巴拉,完成了 MBTI 表情包的制作,轻松地拓展了 IP。

视角转换

此外,视角转换同样是语义编辑中的一个重要应用场景。如下方两张示例图所示,Qwen-Image-Edit 不仅能够实现物体的 90 度旋转,还可以完成 180 度旋转,让我们直接看到物体的背面:

风格迁移

语义编辑的另一个典型应用是风格迁移。例如,输入一张人物头像,Qwen-Image-Edit 可以轻松将其转换为吉卜力等多种风格,这在虚拟形象创作等场景中极具价值:

新增、消除、重绘

除了语义编辑,外观编辑也是常见的图像编辑需求。外观编辑强调在编辑过程中保持图像的部分区域完全不变,实现元素的增、删、改。下图展示了在图片中添加指示牌的案例,可以看到 Qwen-Image-Edit 不仅成功添加了指示牌,还生成了相应的倒影。

下方是另一个有趣的例子,展示了如何在图片中删除细小的头发丝等微小物体。

此外,还可以对图像中指定的字母“n”进行颜色修改,将其变为蓝色,实现对特定元素的修改。

⼈物背景调整、服装修改

外观编辑在人物背景调整、服装更换等场景中同样有着广泛的应用,下面三张图片分别展示了这些实际应用场景。

英文文字编辑

Qwen-Image-Edit 的另一大亮点在于其准确的的文字编辑能力,这得益于 Qwen-Image 在文字渲染方面的深厚积累。如下所示,以下两个案例直观展示了 Qwen-Image-Edit 在英文文字编辑上的强大表现:

中文海报编辑

Qwen-Image-Edit 同样能够直接对中文海报进行编辑,不仅可以修改海报中的大字,连细小的文字也能精准调整。

链式编辑

最后,让我们通过一个具体的图像编辑案例,演示如何利用链式编辑的方式,逐步修正 Qwen-Image 生成的书法作品中的错误:

在这幅作品中,有不少汉字存在生成错误。我们可以借助 Qwen-Image-Edit,逐步修复它们。例如,可以在原图中用方框标注出需要修改的区域,指示 Qwen-Image-Edit 针对这些部分进行修正。这里,我们希望红框内正确地写出“稽”字,蓝色区域正确地写出“亭”字。

但实际操作中,“稽”字较为生僻,模型未能一次性完成修改。“稽”的右下角应为“旨”而非“日”。此时,我们可以进一步用红框圈出“日”的部分,让 Qwen-Image-Edit 对该细节进行微调,将其改为“旨”。

通过这种链式、逐步的编辑方式,我们可以持续修正错字,直至获得理想的最终效果。

最终,我们成功获得了完全正确的兰亭集序书法版本。

附开源地址:

  • ModelScope:https://modelscope.cn/models/Qwen/Qwen-Image-Edit
  • Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit
  • GitHub:https://github.com/QwenLM/Qwen-Image
特别声明:[全能图像编辑 AI 模型 Qwen-Image-Edit 发布,哪里不对改哪里(全能画图板p图)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

肯德基调整部分产品外送价格 应对运营成本变化(肯德基调整部分价格)

从1月26日起,肯德基对部分外送产品价格进行了小幅调整,平均调整金额为0.8元,堂食价格保持不变。肯德基表示,这次调价是为了更好地应对运营成本的变化,确保稳定健康的经营

肯德基调整部分产品外送价格 应对运营成本变化(肯德基调整部分价格)

对辊制砂机出料时的粉尘该怎么减少?(对辊机制砂机器)

对辊制砂机作为重要的设备之一,其出料环节产生的粉尘问题直接影响到工作环境和健康安全。对辊筒内部设置喷雾或者旋风分离器,能够及时捕获并收集飞散的细粉,降低其在空气中的浓度。 通过这些措施的综合应用,可以在一定程…

对辊制砂机出料时的粉尘该怎么减少?(对辊机制砂机器)

张康乐微博之夜Emporio Armani×BVLGARI,复古拼贴里的矜贵少年感(stevenzhang张康阳微博)

身着 Emporio Armani 服饰,搭配 BVLGARI珠宝与腕表,再加上复古拼贴的视觉创意,整套 look既有顶奢的矜贵质感,又藏着少年的灵动鲜活,别出心裁的设计感,直接在红毯造型里打出了记忆点。 …

张康乐微博之夜Emporio Armani×BVLGARI,复古拼贴里的矜贵少年感(stevenzhang张康阳微博)

最穷时只剩40块,64岁港星开99元面馆,二婚太太是他贵人(最穷的时候)

谁能想到,这位曾是香港亚洲电视台当家小生,风光无限的孔雀大师,如今却正系着围裙,站在佛山的一家小面馆里,亲手包着一碗9.9元的云吞面。在最艰难的日子里,她是他那盏始终为他点亮的灯。刘锡贤深情地说:她是命运送给…

最穷时只剩40块,64岁港星开99元面馆,二婚太太是他贵人(最穷的时候)

玛丽苏剧《葡萄庄园的节日》:酒香漫过圣诞,爱意撞个满怀(2021玛丽苏剧)

这也让影片超越了普通浪漫喜剧的框架,在传递爱意与欢乐的同时,给予观众温暖的力量。 作为一部爱情限定的浪漫喜剧,《葡萄庄园的节日》集齐了治愈、浪漫、喜剧、温情等所有冬日观影的关键词。它没有复杂的剧情,却能用最纯…

玛丽苏剧《<strong>葡萄庄园的节日</strong>》:酒香漫过圣诞,爱意撞个满怀(2021玛丽苏剧)