腾讯用王者荣耀训练AI,重新定义“AI游戏智能”(腾讯王者荣耀退款流程)

腾讯研究团队正在用《王者荣耀》重新定义“AI游戏智能”。他们最新提出的“Think in Games”(TiG)框架,首次让AI不仅会打游戏,还能清晰地解释自己为何这么打。

在实验中,这一AI系统通过对真实比赛数据的学习,不仅能制定完整的对局策略,还能用自然语言解释“为什么推上路”“什么时候控龙”——这是过去游戏AI和语言模型都难以同时做到的。

这项研究的目标,是弥合“会玩”与“会讲”的鸿沟。传统AI代理往往能操作游戏角色,却无法说明决策逻辑;而语言模型能讲战术,却无法实时应对复杂局面。Tencent的TiG框架,正是为了让AI具备战略理解与解释能力的统一系统。

在训练中,研究团队选取了《王者荣耀》真实对局的匿名录像,包含胜负各半的数据集。AI学习了40种宏观动作(如“推上路”“控龙”“防守基地”等),通过监督学习 + 强化学习两阶段训练,不断优化判断与策略。

强化学习阶段使用“奖励积分”机制:正确动作得分,错误则为零,从而持续强化决策能力。

令人惊讶的是,小模型的表现反而更出色。

实验结果显示:腾讯使用的 Qwen3-14B 模型,在经过TiG与 Group Relative Policy Optimization (GRPO) 优化后,战略判断准确率达到 90.91%,超过了体量更大的 『DeepSeek』-R1(86.67%)。

与此同时,GRPO 技术显著提高了模型稳定性和泛化性能——比如,Qwen2.5-32B的准确率从66.67%跃升至86.84%。

更值得注意的是,这些AI不仅能下指令,还能“讲思路”。在测试中,它能分析敌方埋伏、识别薄弱防线,并主动推荐最优行动路径。研究团队认为,这一机制在未来有望被应用到其他需要“战略推理 + 可解释决策”的领域,如金融交易、工业调度或自动驾驶规划。

这一研究也揭示了AI发展的新方向:

真正强大的智能体,不只是“更大”,而是“更懂因果、会讲逻辑”。

腾讯的这一成果表明,在AI的下一阶段,比拼的已不再是算力堆叠,而是“策略思维”的深度融合。(AI普瑞斯编译)

特别声明:[腾讯用王者荣耀训练AI,重新定义“AI游戏智能”(腾讯王者荣耀退款流程)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

WAN2.1+2.2:解锁AI本地部署的无限可能

在『数字化』转型浪潮下,WAN2.1+2.2本地部署整合包正悄然改变AI创作生态。它不仅为开发者提供强大的文生图生视频能力,还通过4G显存限制实现高效能计算。本文将带你深入探究这一技术背后的原理、应用场景及未来前景。

WAN2.1+2.2:解锁AI本地部署的无限可能

公布!秀洲这家企业,全省领军!(秀洲区百科)

(来源:嘉兴日报) 转自:嘉兴日报回顾:近日,省发改委公布了2025年浙江省服务业领军企业名单,位于秀洲的嘉兴云切在线科技有限公司凭借在人工智能服务领域的表现与创新成果,成功入选。 亮点:在市场应用层面,云…

公布!秀洲这家企业,全省领军!(秀洲区百科)

她长得漂亮演技好,不愿被潜规则,出道二十余年却无人知(她的长相很好看)

打小就喜欢文艺,后来凭着自己努力,考进了上海戏剧学院表演系。那时候同学里,不少人急着外出见组拍戏,她却沉得下心,把大部分时间都泡在练功房和图书馆,一门心思学本事。但她基本都婉拒了,心思全扑在专业课上。这份专注…

她长得漂亮演技好,不愿被潜规则,出道二十余年却无人知(她的长相很好看)

大学生用“AI+艺术”讲述中国故事

本报讯(中青报·中青网记者 裴思童 实习生石晶)12月6日晚,历经8个月的创作、征集与选拔,2025古剑山·大学生AI艺术应用创新大赛在重庆移通学院(綦江校区)落下帷幕。 这场由新华网、中国青年报社、重庆移…

大学生用“AI+艺术”讲述中国故事

诺里斯夺F1年度车手总冠军 迈凯伦新王登基(诺里斯比赛视频)

北京时间12月7日,2025赛季世界一级方程式锦标赛(F1)收官战——阿布扎比大奖赛正赛落下帷幕。来自迈凯伦车队的英国车手诺里斯获得第三名,并以总积分优势力压红牛车手维斯塔潘和迈凯伦队友皮亚斯特里,赢得职业生涯首个车手总冠军

诺里斯夺F1年度车手总冠军 迈凯伦新王登基(诺里斯比赛视频)