Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行

明敏 发自 凹非寺

量子位 | 公众号 QbitAI

开源编程模型的天花板,要被Qwen3-Coder掀翻了。

今天凌晨, Qwen3-Coder-Flash也重磅开源!

今日霍州(www.jrhz.info)©️

“甜品级”的size,但完全“大餐”级的性能。

  • 多编程任务超越顶级开源模型,仅略逊于闭源的Claude Sonnet-4、GPT-4.1等。

  • 原生上下文窗口支持256k token,可延长拓展至1 million token。

  • 33GB内存(即中端笔记本📓)可运行。

啥概念?

相当于GPT-4.1级别的能力,还能让你本地使用!

今日霍州(www.jrhz.info)©️

有人实测,在苹果M4 Max上通过mlx-lm运行Qwen3-Coder-Flash,每秒可生成4467个token,相当快。

今日霍州(www.jrhz.info)©️

还有人已经火速推出了量化版本,显存不够的童鞋可以来下载使用。

今日霍州(www.jrhz.info)©️

林俊旸也发推表示,这是一个绿色低碳极速版coding模型。

我想这将是本地编程的最好选择。

笔记本📓上就能跑出好效果

Qwen3-Coder-Flash是Qwen3-Coder的精简版,都是非推理模型。

  • 采用MoE架构,30亿参数总量,激活参数3.3亿。

  • 原生上下文窗口支持256k token,通过YaRN等可延长至一百万token上下文,适合大型代码库和复杂多文件工程。

  • 针对Qwen Code、Cline、Roo Code、Kilo Code等平台进行优化。

  • 无缝支持函数调用和agent工作流。

主要强调了 Agent方面的能力:

  • Agentic Coding(智能体编程)

  • Agentic Browser Use(智能体浏览器使用)

  • Agentic Tool Use(智能体工具调用)

有博主在M2 Macbook Pro上用量化版Qwen3-Coder-Flash( 24.82GB 6bit MLX版)做的游戏,运行效果很不错。

今日霍州(www.jrhz.info)©️

而且提示词也很短,就一句话:

Write an HTML and Java page implementing space invaders.

这意味着训练数据中可能存在大量相关或者类似任务,才能让模型一次就能输出非常好的效果。

博主在首次尝试后,感觉飞船发射的子弹太快了,所以想要让它降速一点。

由于他使用的Open WebUI没有类似于Claude Artifacts的工具调用的功能,这意味着模型需要重新输出一个完整结果,实测表明它确实可以做到。

此外他还实测了生成鹈鹕骑自行车,每秒60个tokens,不过效果有点问题。

今日霍州(www.jrhz.info)©️

但u1s1,最近Qwen的开源节奏实在是太快了,更新模型一箩筐:

  • Qwen3-Embedding

  • Qwen-Vlo

  • Qwen-TTS

  • Qwen3-235B-A22B

  • Qwen3-Coder

  • Qwen-MT

  • Qwen3-235B-A22B-Thinking-2507

  • Qwen3-30B-A3B-Instruct-2507

  • ……

而且都开源了,还提出了很多小显存友好的方案。

开源之光的title在国产模型这里竞争格外激烈啊(doge)

最后,Qwen3-Coder-Flash体验方式如下,感兴趣的同学快去体验吧!

QwenChat:chat.qwen.ai

魔搭社区:https://www.modelscope.cn/models/Qwen/Qwen3-Coder-30B-A3B-Instruct

HF:https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct

特别声明:[Qwen新模型直逼Claude4!可拓展百万上下文窗口,33GB本地即可运行] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

官方通报食用油罐车疑似拉化学品 已核实无误(2020食用油)

12月6日,江苏如东县长沙镇人民政府发布情况通报,回应了关于“网曝食用油罐车拉化学用品”的信息。通报称,该镇辖区内一家企业从山东同创精细化工有限公司采购了PAE湿强剂,运输事宜由山东同创委托山东沂水博顺物流有限公司负责

官方通报食用油罐车疑似拉化学品 已核实无误(2020食用油)

日本强震后上百所学校已停课 超10万人受影响(日本此次强震伤亡)

12月8日晚,日本青森县东部海域发生强震,导致30人受伤,一处住宅发生火灾,多个建筑受损。地震影响地区约有5.2万户家庭、超过10万人接到避难提示,大约4200户一度停电。青森县内共有139所公立学校停课

日本强震后上百所学校已停课 超10万人受影响(日本此次强震伤亡)

价格大跳水!上万元买进,现在只能卖200?(价格大跳水!上涨的原因)

2024年中国珠宝行业发展报告》中提到,据不完全统计,2024年中国培育钻石产量约2200万克拉,同比上涨144.44%,占全球总产量的63%。以1克拉高品质培育钻石为例,2025年售价约为8000元,如今…

价格大跳水!上万元买进,现在只能卖200?(价格大跳水!上涨的原因)

拔出萝卜带出泥!『德云社』约谈风波,照见『郭德纲』的艺术困局(拔出萝卜带出泥为什么是禁词)

在此次『郭德纲』和于谦演出被举报并约谈的事件中,『德云社』粉丝的不理智行为可谓是暴露无遗。这种与官方对抗的行为,不仅严重损害了『德云社』的形象,也让人们对『德云社』粉丝的素质产生了质疑,使得『德云社』在舆论场上陷入了更加被动的…

拔出萝卜带出泥!『德云社』约谈风波,照见『郭德纲』的艺术困局(拔出萝卜带出泥为什么是禁词)

2025『新能源』与虚拟电厂交易运营关键技术及实践(2030年『新能源』)

场内收益完全由市场供需决定,需要运营方具备精准的电价预测与交易策略;场外收益则依托政策设计的电价机制形成差价补偿,起到收益“稳定器”的作用。未来,随着市场规则进一步完善、预测与决策技术持续提升,二者将在电力系…

2025『新能源』与虚拟电厂交易运营关键技术及实践(2030年『新能源』)