摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)

IT时报记者 孙妍

2025年7月25日,在世界人工智能大会(WAIC2025)开幕前夕,摩尔线程“AI工厂”成为国产『芯片』产业的焦点。

摩尔线程创始人兼CEO张建中在“算力进化,精度革命”技术分享会上表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程通过系统级工程创新,构建新一代AI训练基础设施,为AGI时代打造生产先进模型的“超级工厂”。

今日霍州(www.jrhz.info)©️

“AI工厂”:AI训练向十万卡级规模演进

全球科技巨头正以惊人的速度迭代模型,从GPT系列、Gemini到『DeepSeek』、QWen的快速更新,模型训练迭代时间已缩短至不足3个月,这种高频迭代不仅体现在大型语言模型(LLM)上,还同步扩展至多模态模型、语音模型、世界模型等前沿模型领域。这些模型在性能、效率和应用场景上实现的指数级突破,不仅推动了AI从专用领域向通用智能的跨越,其快速迭代的特性更对新一代高性能人工智能计算基础设施提出了迫切需求。

摩尔线程提出的“AI工厂”,如同『芯片』晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层『芯片』架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

这座“AI工厂”的智能“产能”,由五大核心要素共同决定,其效率公式可概括为:AI工厂生产效率 = 加速计算通用性 × 单『芯片』有效算力 × 单节点效率 × 集群效率 × 集群稳定性。

摩尔线程以全功能GPU通用算力为基石,通过先进架构、『芯片』算力、单节点效率、集群效率优化与可靠性等协同跃升的深度技术创新,将全功能GPU加速计算平台的强大潜能,转化为工程级的训练效率与可靠性保障。

五大核心技术:系统性提升AI训练效率

摩尔线程通过软硬深度协同的系统级创新,从五大核心技术构建“AI工厂”,致力于推动大模型训练效率实现质的飞跃。

今日霍州(www.jrhz.info)©️

在AI基础设施建设中,计算功能的完备性与精度完整性是支撑多元场景的核心基石。摩尔线程以自主研发的全功能GPU为核心,构建了“功能完备”与“精度完整”的通用性底座,全面覆盖从AI训练、推理到科学计算的全场景需求。

基于MUSA架构的突破性设计,摩尔线程的GPU单『芯片』即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码能力,充分适配AI训推、具身智能、AIGC等多样化应用场景。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升。这一技术体系不仅满足大模型时代的高效计算需求,更为世界模型和新兴AI架构的演化提供前瞻性支撑,助力AI基础设施向高通用性、高精度方向持续升级。

今日霍州(www.jrhz.info)©️

『芯片』的有效算力是驱动“AI工厂”高效运转的核心动力。摩尔线程基于自研MUSA架构,通过计算、内存、通信三重突破,显著提升单GPU运算效率。

摩尔线程采用创新的多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通信资源池。这一设计不仅突破了传统GPU功能单一的限制,还在保障通用性的同时显著提升了资源利用率。其参数化配置可伸缩架构允许面向目标市场快速裁剪出优化的『芯片』配置,大幅降低了新品『芯片』的开发成本。

在计算层面,摩尔线程的AI加速系统支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,在保证计算精度的同时,将Transformer计算性能提升约30%。

内存系统方面,通过多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现了50%的带宽节省和60%的延迟降低。在通信和互联领域,独创的ACE异步通信引擎减少了15%的计算资源损耗,MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽,为大规模集群部署奠定了坚实基础。

当AI算力竞争进入深水区,摩尔线程通过MUSA全栈系统软件实现关键技术突破,推动AI工厂从单点创新转向系统级效能提升,实现『DeepSeek』 R1推理加速1.5倍,全面兼容Triton等主流框架。

当单节点效率达到新高度,如何实现大规模集群的高效协作成为新的挑战。摩尔线程自研KUAE计算集群通过5D大规模分布式并行计算技术,实现上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。

所谓“5D”,就是整合数据、模型、张量、流水线和专家并行技术,全面支持Transformer等主流架构,显著提升大规模集群训练效率。

精准模拟FP8混合精度训练与算子融合,为『DeepSeek』等模型缩短训练周期提供科学依据。针对大模型稳定性难题,将百GB级备份恢复时间从数分钟压缩至1秒,实现秒级备份恢复,提升GPU有效算力利用率。

在构建高效集群的基础上,稳定可靠的运行环境是“AI工厂”持续产出的保障。特别在万卡级AI集群中,硬件故障导致的训练中断会严重浪费算力。摩尔线程创新推出零中断容错技术,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断。这一方案使KUAE集群有效训练时间占比超99%,大幅降低恢复开销。

摩尔线程凭借全功能GPU的通用计算能力、创新的MUSA架构、优化的MUSA软件栈、自研的KUAE集群以及零中断容错技术这五大核心要素,构建起高效的“AI工厂”。

AI工厂,驱动千行百业智能升级

完善的“AI工厂”不仅需要高效训练大模型,还需具备推理验证能力。摩尔线程基于自研MUSA技术栈,构建覆盖LLM、视觉、生成类模型的全流程推理解决方案,实现“训练-验证-部署”的无缝衔接。

这一突破标志着国产计算基础设施已具备支撑AGI时代规模化、高效率、高可靠模型生产的关键能力。

从图形渲染基石到AI算力引擎,摩尔线程全功能GPU持续加速计算革新。以“KUAE+MUSA”为智算业务核心,摩尔线程将加速赋能千行百业,推动全功能GPU驱动的AI技术在物理仿真、AIGC、科学计算、具身智能、智能体、医疗影像分析、工业大模型等关键领域的应用与部署。

开放是生态繁荣之源,摩尔线程将于今年10月举办首届MUSA开发者大会,邀请全球开发者共探前沿技术,共享MUSA自主新生态。

特别声明:[摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

读懂《年轻的小姨子 4》:亲情的长久,藏在理解与尊重里(影响全球的一篇短文:《年轻》读后感)

它所传递的核心价值观,是 “理解与包容”—— 慧仁最终学会了信任妹妹,也懂得了与丈夫坦诚沟通,化解了夫妻间的隔阂;孝琳在姐姐家的这段时光里,逐渐褪去了青涩,学会了尊重他人、独立思考,最终找到了自己的人生方向;…

读懂《<strong>年轻的小姨子 4</strong>》:亲情的长久,藏在理解与尊重里(影响全球的一篇短文:《<strong>年轻</strong>》读后感)

最美亚姐杨玉梅晒近况,没戏拍香港租房,都60了称不敢结婚生孩子(亚视杨玉梅)

她说着这些时先笑了,嘴角弯成的那道弧度,曾经让『周星驰』多加了一句台词,今天依旧挂在她的脸上,但却没有人再给她台词了。杨玉梅将自己最后的一点尊严,保留在了不婚不育这四个字里:她不想拖累别人,也不想再去创造新的溺水…

最美亚姐杨玉梅晒近况,没戏拍香港租房,都60了称不敢结婚生孩子(亚视杨玉梅)

打工人必看!所有人都要注意“用脑卫生”,告别脑疲劳、守护大脑健康(打工人必看的书)

  当下打工人的日常,离不开“费脑”二字:白天对着电脑赶方案、回消息,晚上熬夜加班改报告、刷手机,长期高强度用脑+不规律的生活习惯,慢慢出现头晕脑胀、记忆力下降、注意力不集中的问题,甚至越忙越低效。很多人以为这是“累过头”,休息下就好,却忽

打工人必看!所有人都要注意“用脑卫生”,告别脑疲劳、守护大脑健康(打工人必看的书)

东北智能稳压器怎么选?沈阳金辰阳科技来帮忙(家用型智能节电稳压器)

在东北,有不少专注于智能稳压器研发和生产的品牌,为各行业提供了可靠的电源解决方案。该公司主营电力补偿稳压器、无触点稳压器、感应式稳压器等多样产品,稳压变压一体机、高频中频电源等品种规格齐全,能提供系统整体解决…

东北智能稳压器怎么选?沈阳金辰阳科技来帮忙(家用型智能节电稳压器)

这些零食可能是第三代新型毒品 警惕青少年受害(零食类的东西有什么)

近年来,第三代新型毒品通过伪装成日常零食加速蔓延,其隐蔽性强且主要针对青少年群体,引发社会广泛警惕。这些毒品常以糖果零食、饮品冲剂和电子烟等形式出现

这些零食可能是第三代新型毒品 警惕青少年受害(零食类的东西有什么)