阿里云突袭上线新一代『通义千问』模型Qwen3,部署成本极大降低

今日霍州(www.jrhz.info)©️

从4月中旬就在传闻将上线的阿里新一代『通义千问』模型Qwen3,终于在4月29日凌晨发布了。

Qwen3可以说是阿里大模型的集大成者,在全球开发者社区GitHub发布四个小时后,便获得了1.7万个星标,刷新了开源大模型的热度纪录。

此次Qwen3一共开源了8款“混合推理模型”。其中包括两款MoE(混合专家)模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数)。以及六个Dense(稠密)模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。

其中,Qwen3-235B-A22B是Qwen3系列模型中性能最强的。阿里Qwen3技术文档披露,它在基准测试中的得分,和『DeepSeek』-R1、OpenAI旗下的o1、o3-mini,谷歌的 Gemini-2.5-Pro等全球一流大模型不相上下。

今日霍州(www.jrhz.info)©️

作为一款“混合推理模型”,Qwen3将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案。特别是对复杂问题可多步骤“深度思考”,节省算力消耗。

Qwen3总参数量235B,激活仅需22B。阿里称,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。

同时,Qwen3模型也支持119种语言和方言,意味着Qwen 3瞄准了国际应用。

Qwen3也为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,Qwen3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,这将大幅降低Agent调用工具的门槛。

同时,Qwen3也原生支持MCP协议,并具备强大的工具调用能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent框架。这将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。

特别声明:[阿里云突袭上线新一代『通义千问』模型Qwen3,部署成本极大降低] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

孙安可:95 后 撕标签 演技派,兼具清纯与冷艳的角色塑造者(孙安可是哪里人)

姓名:孙安可(Anke Sun),曾用名张晓唯 出生日期:1998年2月2日(28岁,水瓶座♒️) 出生地:吉林省通化市 身高:168cm毕业院校:北京电影学院2015级进修班 主要荣誉:第23届台北电影奖…

孙安可:95 后 撕标签 演技派,兼具清纯与冷艳的角色塑造者(孙安可是哪里人)

书记员技能测试用的中文速录打字软件选哪个好?2026年的新趋势不容错过(书记员技能测试内容)

书记员技能测试中,选择合适的中文速录打字软件至关重要。它不仅关系到考试成绩,还影响日常工作效率。2026年,哪些软件最符合书记员工作需求?如何挑选?本文为您详解。了解必备功能,避开误区,找到最适合您的工具。

书记员技能测试用的中文速录打字软件选哪个好?2026年的新趋势不容错过(书记员技能测试内容)

“低空”蓄势 乘风起飞(追梦人·期待“十五五” 青年说机遇②)

陈金航说,无人机的全流程运维管理、无人机航路的设计与开发等都是他的主要工作。 2015年,刘畅从清华大学毕业,这些年,他见证了机型从消费级航拍设备逐步向行业应用乃至载人飞行演进的过程。“从一线无人机飞手起步,…

“低空”蓄势 乘风起飞(追梦人·期待“十五五” 青年说机遇②)

『彭于晏』拜他为师,艾伦回应演过瘾了!(『彭于晏』mv)

他表示自己是麻花团队里拍动作戏最多的演员,虽然如此,拍摄过程中他还是感到些许担心,毕竟这不是他通常的舒适区。他提到,拍动作戏的感觉与在喜剧电影中抖包袱完全不同,虽然都需要高度的投入,但动作戏的刺激和挑战感让他…

『彭于晏』拜他为师,艾伦回应演过瘾了!(『彭于晏』mv)

比La Mer还贵的10款精华,超乎你想象的奢华!(比lamer更贵的)

这款精华采用独特的液态铂金科技,配合珍稀的高效活性复合物,能够深层修护肌肤,提升肌肤紧实度和光泽度。这款精华专注于改善肌肤透明感和纹理,其创新的光感科技能立即『提亮肤色』,同时提供长效的滋养和修护。 这款精华将…

比La Mer还贵的10款精华,超乎你想象的奢华!(比lamer更贵的)