央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎(央企背后)

允中 发自 凹非寺

量子位 | 公众号 QbitAI

7月26日,在世界人工智能大会(WAIC)上,中国移动正式发布了MoMA多模型与智能体聚合及服务引擎

MoMA引擎通过汇聚业界多种优质模型与智能体,能够根据应用场景,自动匹配及调用最优专家模型和专用智能体,形成超级大模型能力服务基座,为解决复杂任务提供更为强大的解决方案。

01.当前主要的问题与挑战

目前,国内外已发布多款模型,每个模型在不同时间段内在某些应用场景表现出卓越的能力,例如代码编写、写作、数学、翻译等。

未来将是多种模型共存的局面,HuggingFace已有数百万个这些模型的微调变体。因此,企业在应用这些模型时面临如下挑战:

一是调度与组合难题:如何选择不同能力和接口各异智能体、模型进行有效的组合解决具体问题;二是意图理解与规划挑战:用户指令语义丰富且目标模糊,要求智能体具备更强的意图探测能力,以规划更优执行路径。三是成本收益平衡:如何平衡效率、效果和成本三者关系,达到提速降本的目标。

MoMA通过多级路由技术,主要解决了模型的路由选择和能力规划调度的基础问题,为企业及个人用户解决上述痛点与挑战提供了具体方案。

02.MoMA是什么?

九天MoMA(Mixture of Models and Agents)即多模型与智能体聚合及服务引擎,通过标准化接口广泛汇聚业界优质大模型与专用智能体,面向复杂行业场景提供“场景-模型-智能体”的自动感知、动态编排与最优调用能力,形成具备持续进化特性的超级大模型服务基座,提供高准确率、高安全、高可靠、高效能的大模型推理服务。

MoMA核心主要包括三部分:

MoMA模型

MoMA根据对模型能力的探测和智能体能力的评估,以及对用户意图的理解和识别,明确不同组合下的协同优势与潜在冲突;根据对用户输入的分析,判断模型和智能体的依赖关系及其能力范围,自动选择最佳方案。

同时,通过闭环监控反馈机制,构建“实时感知-动态调整-持续验证”的循环链路,以更好地适应数据变化、业务需求和环境波动。

模型能力洞察及构建主要通过对模型和智能体能力的深入探测,从成本、效果和难易程度等方面构建其能力高维表征,实现用户需求与智能体路由的快速匹配;通过评分机制,评估不同模型和智能体的效果,便于分层路由模型进行快速任务分发。

通过原创性地提出“问题难度-领域矩阵”(Problem-difficulty vs. Domain Matrix, PD²-Matrix)的『大语言模型』(LLM)系统性框架,核心目标是通过标准化分类与评估,全面揭示模型在不同任务场景下的表现边界,以及不同模型在相同领域问题上的排名情况。

该框架将任务按照问题复杂度与知识领域两个正交维度进行系统化分类,并在每个矩阵单元设计差异化的评估指标。其核心创新在于将『大语言模型』的“黑箱”能力转化为结构化的“能力矩阵”,通过正交维度分类、探测工具和可视化分析,实现了从“笼统评估”到“精准诊断”的跨越。

在PD²-Matrix框架下,采用Pareto优化拟合给定任务分布上 T的模型得分(效果)S(T)与成本C的得分–成本(S-C)曲线,实现了效果和成本之间的动态权衡和调整。

通过上述流程,不仅在 PD²-Matrix 框架下实现了对性能-成本关系的可解释建模,还能以任务分布T为条件,为不同下游应用提供个性化的资源-性能权衡策略,最终达到“用最小的成本获得所需的性能”这一核心目标。

MoMA工程引擎

以分层路由与动态编排为核心,通过标准的协议连接模型、智能体、工具,形成超级大模型能力基座,实现对任务类型、资源分配、执行流程的动态管理,在效果、成本、效率三重约束下完成最优决策,提速降本。

多级路由机制及动态洞察

在分层路由模型机制中,多级路由各司其职,分层次完成复杂任务的拆解与实现。其中一级路由完成专家模型、简单任务、复杂任务的分发;二级路由在综合准确度和成本的条件下,根据复杂度把问题分发到具备不同参数规模或者是专长的专家模型予以响应;采用Monitor Model对推理内容进行实时监控、复盘两级路由模型的分发质量,同时丰富标注数据集动态优化路由模型。

复杂任务去中心化

对于用户多意图及复杂任务,MoMA工程引擎采用了Planner-Executor-Summarizer架构,能够根据具体任务动态地采用ReAct、Route、Parallelize、Swarm等混合模式,实现任务的自动拆解、编排与并行调用。

传统AI系统通常采用固定模式回答问题,规划执行的步骤越多,所需的计算资源也越多,在某些任务中,AI可能在无需人工干预的情况下执行数十个步骤。通过采用复杂任务路由技术,将请求发送给专门的规划模型,选择不同的执行模式或混合模式,将用户的意图分配至合适的智能体或大模型,并通过监控推理输出内容,进行动态接管与调整,从而保证回答的效果和效率。

此外,这种方式还避免了或减少了依赖中心规划模型对智能体或工具输出内容的重复推理评估,降低了输出幻觉,提升了整体响应时间,全面优化了用户体验。

MoMA协议体系

目前针对模型与外部工具、数据源之间,智能体与智能体之间的协同问题,业界已有部分协议尝试对其进行规范化。主流协议包括Anthropic公司提出的MCP(Model Context Protocol,模型上下文协议)和Google提出的A2A(Agent2Agent)。

其中MCP是一种用于规范模型或智能体与外部数据源、工具和服务之间的交互的开放协议,其通过结构化的输入/输出将模型或智能体与工具、API和资源连接起来,可以将其视为模型或智能体扩展自身能力的标准方式。

A2A协议则是一种用于智能体之间通信与互操作性的开放标准,其为由不同框架、不同语言或不同厂商构建的智能体提供了一套通用的语言与交互接口。原生的MCP协议没有对模型和工具之间交互的安全性进行限制,同时工具对模型的可调度性也缺少规约。

MoMA在兼容业界规范的基础上拓展统一认证、安全通信等能力,对工具的可调度性进行了增强,在此基础上构建了中国移动特色的A2A,MCP协议,实现对业界智能体生态的兼容,形成开放、安全、可信、高效的中国移动智能体技术体系的服务底座。

03.MoMA应用

MoMA聚合包括九天大模型、Qwen和『DeepSeek』等15+个高质量内外部模型,涵盖通用模型和专业模型,涉及编程、数学、翻译、医疗等多个领域,并接入了20多个专家智能体,例如日常管理、会议助手、咪咕音乐和深度报告等,帮助用户迅速解决专业领域的问题,精准匹配用户需求。

在覆盖百万级用户的情况下,MoMA的动态路由机制在不同参数模型(1B、3B、8B、75B、200B)之间灵活切换,整体速度相比固定的75B参数模型提升了42%。

目前,MoMA已应用于中国移动的灵犀智能体2.0,助力灵犀智能体全面升级为跨领域、多任务、自规划的通用型智能体,为用户在“通信、生活、出行、办公、家庭”等多元化场景中提供特色服务。

04. 商业化落地愿景

中国移动在新技术研发的道路上一直持续深耕并获得广泛认可,MoMA聚合引擎的发布提供了中国移动与各产业合作的新范式。

随着更多行业实践的深入,中国移动将持续释放生产力价值,致力于为开发者及大模型企业提供人工智能快速解决方案,在技术创新、产品迭代与生态建设方面,持续前进,为广大用户提供更好的产品与服务,带动产业与技术的创新与规模化发展。

通过MoMA多模型与智能体聚合及服务引擎,中国移动将依托充沛的算力资源,实现业界优质大模型及智能体的汇聚及灵活调度,构建起百模互联、千智协同的全新产业协同生态,打造AI能力聚合和普惠服务的全新智能服务范式,将驱动中国人工智能产业迈入发展新阶段。

特别声明:[央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎(央企背后)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

78岁开唱被骂割韭菜,她站两小时没坐,观众却默默擦眼泪(78岁歌手)

这场演唱会的票价从680元到1880元不等,虽然不算便宜,但当时几乎没人相信这场演唱会能够成行,连她自己也没有大肆宣传,似乎只是悄悄地做了一些安排。大家普遍认为,像汪明荃这样年纪大了的人应该选择安静地退场,继…

78岁开唱被骂割韭菜,她站两小时没坐,观众却默默擦眼泪(78岁歌手)

佟丽娅『陈思诚』合体庆生:离婚后“协作育儿”成『娱乐圈』️新范本

现场视频显示,佟丽娅蹲下身为朵朵整理衣领时,『陈思诚』已提前递上温水;当朵朵与小伙伴玩耍时,两人分别站在不同角度拍照,结束后还交流拍摄角度;甚至在切蛋糕环节,『陈思诚』主动接过佟丽娅手中的刀,笑着说“你负责美,我负责…

佟丽娅『陈思诚』合体庆生:离婚后“协作育儿”成『娱乐圈』️新范本

你的心血文章正被AI遗忘!别让努力输给机器的‘看不见’(你的心头血是什么歌)

GEO排名工具正是为此而生,它们通过模拟真实用户的提问场景,监测和分析品牌、网站或特定内容在各类AI对话平台(如『豆包』、文心一言、ChatGPT等)中的被提及率、推荐排名和引用上下文,从而提供针对性的优化策…

你的心血文章正被AI遗忘!别让努力输给机器的‘看不见’(你的心头血是什么歌)

2月新规:拒收人民币现金属违法,平台不得利用大数据“杀熟” 多项法规同步实施(拒收的时间范围)

2026年2月起,一批新的法律法规将开始施行,涉及人民币现金支付、直播电商管理、行政执法监督等多个方面。任何单位和个人不得拒收现金。中国人民银行联合国家发改委、金融监管总局制定的《人民币现金收付及服务规定》将于2026年2月1日起正式施行

2月新规:拒收人民币现金属违法,平台不得利用大数据“杀熟” 多项法规同步实施(拒收的时间范围)

北京市民排队8小时买黄金 购金热潮再现(北京排队软件)

国际黄金和白银价格在29日经历了剧烈波动,双双站上高位后暴跌。纽约商品交易所4月黄金期价当天早盘一度触及每盎司5626.80美元💵,3月白银期价一度触及每盎司121.785美元💵

北京市民排队8小时买黄金 购金热潮再现(北京排队软件)