2025年图灵奖公布:两位AI先锋因强化学习获奖

今日霍州(www.jrhz.info)©️

巴托和萨顿

凤凰网科技讯 北京时间3月5日,据《纽约时报》报道,全球最大的计算机专业人士协会计算机协会(ACM)周三宣布,将2024年图灵奖授予安德鲁·巴托(Andrew Barto)博士和理查德·萨顿(Richard Sutton)博士,以表彰他们在 强化学习方面的研究。

巴托目前是马萨诸塞大学荣誉退休教授。萨顿现在担任阿尔伯塔大学教授,他也是前DeepMind研究科学家。两人将分享图灵奖的100万美元💵奖金。图灵奖设立于1966年,常被称为 “计算机界的诺贝尔奖”。

“他们是强化学习领域无可争议的先锋,”华盛顿大学计算机科学荣誉退休教授、艾伦AI研究所创始人兼CEO奥伦·埃特齐恩(Oren Etzioni)表示,“他们提出了关键理念,并且撰写了这方面的权威著作。”

过去十年,强化学习在人工智能(AI)的崛起中发挥了至关重要的作用,其中包括谷歌的AlphaGo和OpenAI的ChatGPT等突破性技术。支撑这些系统的技术就源于巴托博士和萨顿博士的研究成果。

1977年,巴托在马萨诸塞大学阿默斯特分校担任研究员时,开始探索一种新的理论,即神经元的行为类似于享乐主义者。该理论的基本理念是,人类大脑由数十亿个神经细胞驱动,每个神经细胞都在努力将愉悦感最大化,把痛苦感最小化。

一年之后,另一位年轻的研究员萨顿也加入了他的行列。他们一起努力用这个简单的概念来解释人类的智力,并将其应用于AI领域。他们的研究成果便是强化学习,这是一种让AI系统从数字世界的“愉悦”与“痛苦”中学习的方法。

2016年AlphaGo战胜李世石震惊世界,这场人工智能的“登月时刻”背后,正是强化学习的威力体现。谷歌DeepMind团队核心成员大卫·席尔瓦,正是萨顿在阿尔伯塔大学培养的弟子。通过数百万次自我对弈,系统建立起“胜者愉悦-败者痛苦”的反馈机制,最终突破人类千年围棋智慧。

这种学习范式在ChatGPT等『大语言模型』中继续进化。2022年底,OpenAI通过“人类反馈强化学习”(RLHF)技术,让数百名标注员引导模型优化应答。当聊天『机器人』️学会辨别优质回答获得“奖赏”,其对话能力产生质的飞跃。近期 『DeepSeek』等企业更开发出自主强化学习系统,使AI能像解数学题般,通过试错掌握逻辑推理能力。

现年76岁的巴托教授指出:“ 通过强化学习控制物理躯体,将是自然演进的下个阶段。”目前任职于Keen Technologies的萨顿同样认为,当前基于文本的学习只是序章, 未来『机器人』️将在真实世界中像生物般试错成长。(作者/箫雨)

特别声明:[2025年图灵奖公布:两位AI先锋因强化学习获奖] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

刘浩存『赵今麦』同框斗艳:明明都是00后,有人像公主有人像领证(刘浩存蹭)

如果你以为这不过是一场普通的品牌活动,那你就大错特错了。刘柏辛那一抹墨蓝色的飞扬眼线,再加上她那随性而拽的表情,展现了她的独特魅力,完美诠释了时尚不仅仅看脸,更要看气场的真谛。4. **大合照背后的真相:C…

刘浩存『赵今麦』同框斗艳:明明都是00后,有人像公主有人像领证(刘浩存蹭)

第二届钙钛矿新材料、新特性、新器件(PN³)学术研讨会在通举办(钙钛矿新材料)

中国科学院院士、宁波诺丁汉大学校长谢心澄以《迈向无能耗拓扑电子学》为题作大会报告,深入阐述了拓扑物态在未来低功耗电子学中的前沿探索;斯洛文尼亚工程院外籍院士、国际欧亚科学院院士陆亚林分享了《近场显微:从微波…

第二届钙钛矿新材料、新特性、新器件(PN³)学术研讨会在通举办(钙钛矿新材料)

IMiss爱蜜社破解|淡蓝色短裙小姐姐甜美风(imse爱蜜社)

一、主调定调:浅蓝主裙,像海盐芝士般清爽整套『穿搭』的灵魂是浅蓝短袖连衣裙👗,像好利来经典的海盐系列甜品,自带降温感却不冷冽。发型的点缀是整套『穿搭』的 “隐藏甜分”:黑色网纱发饰将『长发』挽起,露出纤细的颈部线条,与…

IMiss爱蜜社破解|淡蓝色短裙小姐姐甜美风(imse爱蜜社)

小姨子》:用4部韩国伦理影片读懂亲属关系里的理解与疏离(驯服小姨中字头歌词韩国电影中文)

这些影片没有刻意煽情,却用最朴素的叙事,将家庭亲属间的情感褶皱一一舒展,让我们在他人的故事里明白,无论是有血缘关联的亲人,还是后天相伴的“临时亲属”,那些发自内心的关爱与守护,那些心甘情愿的付出与担当,才是亲…

《<strong>小姨子</strong>》:用4部韩国伦理影片读懂亲属关系里的理解与疏离(驯服小姨中字头歌词韩国电影中文)

2025年智能体时代:重塑企业未来报告(2035年的智能时代)

三份报告共同构建了一个以&quot;发现-理解-行动&quot;(Discover-Understand-Act)为核心的方法论框架,展现了智能体如何从被动响应转为主动决策,从单点工具进化为跨系统协作的数字员工,最终推动企业

2025年智能体时代:重塑企业未来报告(2035年的智能时代)