通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平

凤凰网科技讯 7月30日,阿里巴巴『通义千问』团队宣布推出Qwen3系列模型的最新版本 ——Qwen3-30B-A3B-Instruct-2507。这一非思考模式(non-thinking mode)的开源模型仅需激活3B参数,即可在多项核心能力上达到与Gemini 2.5-Flash(non-thinking)、GPT-4o等闭源模型相当的性能水平,同时在多语言覆盖、用户偏好对齐和长文本处理等领域实现突破性提升。目前,该模型已在魔搭社区(ModelScope)和HuggingFace平台全面开源。

今日霍州(www.jrhz.info)©️

作为Qwen3-30B-A3B模型中的新版本,Qwen3-30B-A3B-Instruct-2507延续了『通义千问』团队在架构创新上的优势,在大幅降低计算成本的同时,实现了与千亿级闭源模型的性能对标。官方数据显示,该模型在数学推理(AIME25测试得分61.3)、代码生成(LiveCodeBenchv6得分43.2)、研究生级物理和天文学问题(GPQA测试得分70.4)、人类偏好对齐(Arena-Hard v2得分69)、函数调用能力(BFCL-v3得分65.1)等关键基准测试中表现突出,部分指标甚至超越GPT-4o等。

今日霍州(www.jrhz.info)©️

在通用能力层面,模型全面强化了指令遵循、逻辑推理、数学、科学、编程及工具使用等多方面。在多语言的长尾知识覆盖方面,模型进步显著;在主观和开放任务中,新模型与进一步紧密对齐了用户偏好,可以生成更高质量的文本,为用户提供更有帮助的回答;长文本理解能力提升至256K。

『通义千问』是阿里巴巴达摩院自主研发的『大语言模型』系列,自2023年发布以来,已开源超200个模型,全球下载量突破3亿次,衍生模型数超10万个。

特别声明:[通义Qwen3非思考模型上新 多项能力达到Gemini2.5、GPT-4o水平] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

张艺凡无滤镜大头贴杀疯了!镜头怼脸还能美成模板?(张艺凡滤镜图片)

最近,张艺凡凭借一组无滤镜的怼脸特写,瞬间引爆了热搜,大家纷纷赞叹她这颜值是不是开了天然磨皮?无论是在音乐派对上展示暗黑与纯白造型的反差切换,还是素颜出镜依然透亮动人的通透颜值,都让她的美貌多了一层耐打buf…

张艺凡无滤镜大头贴杀疯了!镜头怼脸还能美成模板?(张艺凡滤镜图片)

盐系轻酷『穿搭』适配所有场景,日常通勤皆可穿,低调又有记忆点(盐系男生『穿搭』)

早上八点挤进电梯,西装外套🧥没扣扣子,内搭是米白肌理棉T恤👕,袖口随意挽到小臂中段,露出一截手腕和一块表盘素净的旧钢表——没人盯着你打量,但三秒后,你已从背景板里浮出来。它不帮你成为别人眼中的焦点,但它确保——当…

盐系轻酷『穿搭』适配所有场景,日常通勤皆可穿,低调又有记忆点(盐系男生『穿搭』)

『王凯』、彭昱畅、欧豪……央视大剧,正在漳州拍摄!(彭昱畅『王源』同框)

交锋》由一宗世纪之交的泄密大案而起,讲述了二十世纪九十年代末,闽州市国家安全局一对性格迥异的师徒,因机缘巧合的命运安排,为了共同的使命与信仰并肩作战的故事。让漳州港人在刷剧的同时 一起邂逅电视剧里的漳州…

『王凯』、彭昱畅、欧豪……央视大剧,正在漳州拍摄!(彭昱畅『王源』同框)

折叠屏史上最大电量 荣耀Magic V6突破7000mAh:领先友商2代(折叠屏第一款)

快科技1月31日消息,荣耀将在巴塞罗那MWC大会上正式推出全新一代折叠屏旗舰荣耀Magic V6,其主打超大电池和轻薄机身。据悉,荣耀Magic V6折叠屏内部代号Phenom,备案配色有雪域白、绒黑色、旭…

折叠屏史上最大电量 荣耀Magic V6突破7000mAh:领先友商2代(折叠屏第一款)

『杨幂』这组大片杀疯了!黑裙红唇配长腿,36岁状态好到炸(『杨幂』演戏视频)

最绝的是她那个眼神,又纯又欲带着点疏离感,像只慵懒的波斯猫,谁看了不迷糊啊!第一张的几何耳环小巧精致,第二张的金色臂环又A又飒,还有那个珍珠项链,简单一条就提升了整个造型的高级感。果然时尚icon就是不一样,…

『杨幂』这组大片杀疯了!黑裙红唇配长腿,36岁状态好到炸(『杨幂』演戏视频)