高通:OpenAI 最小开源模型 gpt-oss-20b 可在『骁龙』终端运行(高通 npu)

8 月 11 日消息,OpenAI 于 8 月 6 日推出了其最小开源模型 gpt-oss-20b,在常见基准测试中与 OpenAI o3‑mini 模型取得类似结果。高通今日宣布,这是其首个可在搭载『骁龙』平台的终端侧运行的开源推理模型。

从官方新闻稿获悉,高通称 gpt-oss-20b 思维链推理模型可直接在搭载『骁龙』旗舰处理器的终端上运行。此前 OpenAI 的复杂模型仅限云端部署,这是 OpenAI 首次实现模型支持终端侧推理。通过提前获取模型,并结合高通 ® AI 引擎和 Qualcomm® AI Stack 进行集成测试,我们发现这款 200 亿参数的模型表现极为出色,能够完全在终端侧进行思维链推理。

高通认为这是一个关键转折点:预示着 AI 的未来方向,即丰富复杂的助手式推理也将在本地实现。这也展现了 AI 生态系统的成熟性,合作伙伴和开发者可以利用『骁龙』处理器,实时采用 OpenAI 等领军企业的开源创新成果。OpenAI 的 gpt-oss-20b 将助力终端设备利用终端侧推理,带来隐私保护和时延方面的优势,同时通过 AI 智能体为云端解决方案提供支持。

高通称,通过提前获取 gpt-oss-20b 模型,并结合 Qualcomm AI Stack 进行集成测试,见证了该模型的卓越能力,它能完全在终端侧进行复杂推理。开发者将可通过 Hugging Face 和 Ollama 等主流平台获取该模型,并在搭载『骁龙』平台的终端上发挥其性能。更多部署详情即将在 Qualcomm AI Hub 上公布。

将 Ollama 的轻量级的开源 LLM 服务框架和强大的『骁龙』平台集成,开发者和企业不仅可以直接在搭载『骁龙』计算平台的终端上运行 gpt-oss-20b 模型,还能够进行网页搜索等多个默认特性,无需额外配置。用户也可以在 Ollama 上尝试 Turbo 模式,以探索该模型的更多功能。

特别声明:[高通:OpenAI 最小开源模型 gpt-oss-20b 可在『骁龙』终端运行(高通 npu)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

雍正年制青花釉里红人物纹矮足杯一对(雍正青花釉里红)

这对矮足杯,正是这一特定历史环境下,为满足皇帝本人及其宫廷高层清赏品味而诞生的高雅艺术品,其设计构思与制作水准,皆非寻常官窑器可比。它承载的是雍正时期独特的文化气质:一方面是对宋代以降文人雅士生活的向往与摹写…

雍正年制青花釉里红人物纹矮足杯一对(雍正青花釉里红)

2026杭州婚纱摄影推荐:风格深耕者的隐形冠军图鉴(杭州十大婚纱摄影店)

差异化对比:相较于其他商家,其复古妆造团队从业年限均≥5年,在细节把控上更具优势,客片传播度在小红书杭州复古婚纱摄影话题中占比12%。 维度表现拆解:核心优势——支持风格共创,每月研发2套限定主题;套餐价格…

2026杭州婚纱摄影推荐:风格深耕者的隐形冠军图鉴(杭州十大婚纱摄影店)

影史最佳100部新德国电影(影史最佳100部新片)

1971 科姆巴赫的穷人突然发了财 Der plötzliche Reichtum der armen Leute von Kombach1974 弗兰茨·布鲁姆的暴行 Die Verrohung des…

影史最佳100部新德国电影(影史最佳100部新片)

澳网2026 张帅组合挺进女双决赛(澳网张帅女双比赛)

1月29日,澳网2026女单半决赛中,张帅和梅尔滕斯以2:0战胜了柴原瑛菜和兹沃娜列娃,成功晋级女双决赛。在首盘比赛中,张帅组合率先破发,并且成功保住了所有发球局,最终以6-3拿下首盘

澳网2026 张帅组合挺进女双决赛(澳网张帅女双比赛)

原来这些星二代都是留子,国内乖巧女,国外玩反差,共性显著

公众一直认为她是那个穿着简约T恤👕、被父母严格教育成贵族形象的少女,然而,这个形象在她离开国内,前往瑞士深造后,发生了巨大的变化。她的变化,像是一种内心的释放,抛弃了那个早已不适合的乖巧少女形象,开始大胆展现自…

原来这些星二代都是留子,国内乖巧女,国外玩反差,共性显著