Qwen开源版Banana来了!原生支持ControlNet(qq开源版app)

(来源:量子位)

Qwen版Banana来了!

刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。

不仅支持多图融合,提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法,还增强了人物、商品、文字等单图一致性。

除此之外,它还原生支持ControlNet,可通过关键点图改变人物姿势,还可轻松实现换装需求。

图像编辑之余,Qwen还开源了端到端全模态模型Qwen3-omni,表现也可圈可点。既可当语音翻译助手,还能立不同的人设,甚至支持方言输出。

下面具体来看。

支持多图输入

新图像编辑的首要更新就是支持了多图输入。

先看一个“人物+人物”生成结婚照的例子。

输入两张图片:

然后,输入以下提示词:

结果闪亮登场:

不喜欢中式婚礼的也没事,我们还可以生成西式的,主打一个用户就是上帝。

再看“人物+场景”的应用,感觉可轻轻松松实现环球旅行。

令我比较惊讶的是,这还真不是简单的图像拼接,它甚至贴合场景改变了主角🎭️的神态,闭眼享受阳光的动作、躺椅上的影子,说实话,p图我都p不出来这么细。

下面轮到“人物+物体”了,我把它称为最快拥有『奢侈品』包包和豪车的方式。

此外,多图输入也支持ControlNet常用的关键点图,比如改变人物姿势。

还能在改变关键点的同时,进行换装。

除此之外,普通证件照、形象照、生活照也是so easy。

想要Banana大火的美式精英风?无论是半身还是全身照,你想要的Qwen都有。

还能进行不同的姿势编辑,俏皮、比心、举黑板都是不在话下。

基于新模型上述图像编辑能力,再加上其本身特色的文字生成能力,团队发现它还很擅长制作表情包。

当然,对于更长的文字,新模型也依然可以在保持人物一致性的前提下进行渲染。

更有意思的是,它还可以给老照片进行修复,比如给照片上色。

还可以修复破损照片。

但是,这个美颜……

除了真实人物,生成卡通玩偶、文创也是分分钟的事啦。

咦?这左下角不就是Nano Banana爆火的手办吗?Qwen新模型效果看起来也是很不错的。

1个物品太简单了,咱们再换个有14只猫的图片试一下。

哇哦,猫的数量是对的,效果也是相当可以。

除了图像方面,新模型还专门增强了文字一致性,支持了包括字体类型编辑、字体颜色编辑和字体材质编辑。

此外,它还支持定点文字编辑,细致到可将圈出来的错字进行定点修改。

效果是这样滴:

不仅如此,新模型还支持深度图控制,保持物体与场景的一致性。

哎呀,这泥泞的道路、茂盛的丛林、真实的车辙印,真的不是户外山地车的广告吗?

只有关键点也不耽误出图,无论男女、无论古代还是现代、无论什么穿着,Qwen都能统统搞定。

最后就是根据草图来控制生图,这一老一少真给人一种时光穿梭的感觉,再配个bgm氛围感直接拉满。

还有端到端全模态模型

Qwen不仅在图像编辑上表现优异,它还开源了端到端、全模态大模型Qwen3-omni,不仅能够无缝处理文本、音频、图像和视频等多种输入形式,还能边生成文字边实时合成语音。

主要特点如下所示:

跨模态的领先性能:在36项音频及音视频基准测试中,Qwen3-omni斩获32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro、Seed-ASR、GPT-4o-Transcribe等闭源强模型,同时其图像和文本性能也在同尺寸模型中达到SOTA水平。

多语言方面:Qwen3-omni支持119种文本语言、19种语音输入语言和10种语音输出语言。

不仅是实时翻译助手,还能直接总结网页内容,然后用你所需要的语言输出。

更快响应:端到端音频对话延迟低至211ms,视频对话延迟低至507ms。

长音频:支持长达30分钟音频理解。

个性化:支持system prompt随意定制,可以修改回复风格,人设等。

比如广东幼儿园老师或是四川女汉子。

咦,那么问题来了,这些方言是否标准噻?

工具调用:支持function call,实现与外部工具/服务的高效集成。

开源通用音频Captioner:开源Qwen3-Omni-30B-A3B-Captioner,低幻觉且非常详细的通用音频caption模型,填补开源社区空白。

不仅能分析音乐风格,还能推理数学题,甚至还能当起语音助手唤醒其他应用。

这花里胡哨的功能真是令人眼花缭乱,感兴趣的读者赶紧去试试吧。

参考链接:

[1]https://huggingface.co/Qwen/Qwen-Image-Edit-2509

[2]https://qwen.ai/blog?id=7a90090115ee193ce6a7f619522771dd9696dd93&from=research.latest-advancements-list

[3]https://github.com/QwenLM/Qwen3-Omni

特别声明:[Qwen开源版Banana来了!原生支持ControlNet(qq开源版app)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

『梁洛施』罕见谈离开李泽楷原因:他很富有,是一生挚爱,也不后悔(『梁洛施』宣布分手)

正如她所说,李泽楷的受欢迎程度让她总是感到一种挥之不去的危机感,而她对家庭温暖的渴望,与这种不安交织在一起,最终成了她心头的一道无法跨越的坎。她渴望的底气,并非外界所认为的财富,而是精神上的独立与自由——她要…

『梁洛施』罕见谈离开李泽楷原因:他很富有,是一生挚爱,也不后悔(『梁洛施』宣布分手)

卢伟冰:小米智能家电工厂正紧密准备面向公众开放参观(卢伟冰怎么成为小米副总裁的)

全厂智能物流覆盖率高达 94%,极大地提升了效率,并减少了传统运输可能带来的损耗。小米智能家电工厂通过先进的 AI视觉质检技术,实现了对内外机主板、注塑件、钣金件、风轮、蒸发器、冷凝器等关键零部件的 100…

卢伟冰:小米智能家电工厂正紧密准备面向公众开放参观(卢伟冰怎么成为小米副总裁的)

上海100人以上年会抽奖怎么策划?_大屏幕抽奖摇一摇互动(上海超过100岁老人有多少)

上海的家人们等了一年,最盼的是老板讲话? ✅ 微信扫码即参与 ✅ 百人千人同屏互动 ✅ 视觉震撼+情感温度兼具 💬员工反馈:“看到自己头像在大屏上发光,瞬间觉得自己是主角🎭️!” 观众扫码签到时,输入一句新…

上海100人以上年会抽奖怎么策划?_大屏幕抽奖摇一摇互动(上海超过100岁老人有多少)

36岁人妻在家出道?金城沙织:从同学会到片场的神展开!

她的出道经历简直像是一部魔幻现实主义的剧本:参加一个同学会,偶遇了个导演同学,最后就在自家客厅直接出道!】 如果说她的出道经历已经够离谱,那金城沙织本人的条件简直是逆天的存在:36岁的年纪,脸上胶原蛋白满…

36岁人妻在家出道?金城沙织:从同学会到片场的神展开!

玥儿奶奶重男轻女 只给孙子夹菜 自己穿羽绒服 箖箖却只穿一件薄卫衣(玥儿是什么电视剧穿越)

小箖箖在小杨阿姨的陪伴下开心地玩耍,而奶奶则走过去接她,两人手中各自抱着一团雪,嬉戏着打雪仗。餐桌上,玥儿优雅地坐着,扶着头发安静地吃饭,而奶奶则不停地往小箖箖的盘子里夹排骨,温柔的举动却被部分网友解读…

玥儿奶奶重男轻女 只给孙子夹菜 自己穿羽绒服 箖箖却只穿一件薄卫衣(玥儿是什么电视剧穿越)