脑机启侦 | 乐观与悲观神经元:大脑如何在决策中平衡风险与回报(02.27)

图片来源:Pixabay

每一天,我们的大脑都会做出成千上万个大大小小的决策。这些决策——从最微不足道的选择餐馆,到更重大的决定如更换职业或搬到新城市——都可能导致更好的或更差的结果。

那么,大脑是如何衡量风险和回报来做出这些决策的呢?这个问题一直困扰着科学家们,但哈佛医学院和哈佛大学的一项新研究为我们提供了有趣的线索。

研究背景与发现

这项发表在《自然》(Nature)杂志上的研究,将机器学习的概念融入小鼠实验中,以探索支持奖励型决策的大脑回路。

研究人员在小鼠大脑中发现了两组神经细胞:一组帮助小鼠学习高于平均水平的结果,另一组则与低于平均水平的结果相关联。这两组神经元共同作用,使大脑能够评估与某一选择相关的所有可能回报范围。

“我们的结果表明,小鼠——以及通过延伸,其他哺乳动物——似乎比我们之前认为的更能代表关于风险和回报的细微细节。”该研究的共同资深作者、哈佛医学院布拉瓦尼克研究所神经生物学副教授Jan Drugowitsch说道。

如果这一发现能在人类中得到验证,它可能会为理解人类大脑如何做出基于奖励的决策提供框架,并揭示当奖励回路失效时,判断风险和回报的能力会发生什么变化。

机器学习照亮奖励型决策

神经科学家长期以来一直对大脑如何利用过去的经历来做出新的决策感兴趣。然而,Drugowitsch指出,许多传统理论未能捕捉到现实世界行为的复杂性和微妙之处。

他以选择餐馆为例:如果你倾向于稳妥,你可能会选择一家经验告诉你菜品可靠的餐厅;而如果你愿意冒险,你可能会选择一家提供优秀和普通菜品混合的餐厅。

在这个例子中,两家餐馆提供的菜品范围差异很大,但现有的神经科学理论在平均化后将它们视为等同,并预测选择任何一家的可能性相同。

“我们知道这并不是人类和动物的行为方式——我们可以决定是追求风险还是选择稳妥。”Drugowitsch说,“我们对选择所关联的不仅仅是平均预期奖励有更深刻的感受。”

近年来,机器学习研究人员开发了一种决策理论,能够更好地捕捉与某一选择相关的所有潜在回报。他们将这一理论整合到一个新的机器学习算法中,该算法在Atari视频游戏和其他涉及多种可能结果的任务中表现优于其他算法。

“他们基本上问的是,如果算法不仅仅学习某些行为的平均奖励,而是学习整个分布情况,会怎样?结果表明,这种做法显著提高了性能。”Drugowitsch解释道。

在2025年的一篇《自然》论文中,哈佛大学分子与细胞生物学教授Naoshige Uchida及其同事重新分析了现有数据,探讨了这一机器学习理论是否适用于神经科学,特别是啮齿类动物大脑中的决策过程。

分析显示,在小鼠中,『多巴胺』(一种参与奖励寻求、愉悦和动机的神经递质)的活动与算法预测的奖励学习信号相对应。

换句话说,Drugowitsch表示,这项工作表明新算法在解释『多巴胺』活动方面更为出色。

小鼠大脑如何表示回报范围

在新研究中,Drugowitsch与共同资深作者Uchida进一步合作,设计了小鼠实验,观察这一过程如何在被称为腹侧纹状体(ventral striatum)的大脑区域中展开。腹侧纹状体储存与某一决策相关的可能奖励信息。

“『多巴胺』活动仅提供预期奖励的学习信号,但我们希望直接找到大脑中这些已学习奖励的表征。”Drugowitsch说。

研究人员训练小鼠将不同的气味与不同大小的奖励联系起来,从而教会小鼠某一选择的所有可能结果。

随后,他们向小鼠呈现气味,同时观察其舔舐行为(小鼠在期待更好奖励时会更多地舔舐),并记录腹侧纹状体的神经活动。

研究团队在大脑中识别出两组截然不同的神经元:一组帮助小鼠学习超出预期的结果,另一组与低于预期的结果相关联。

“你可以将其想象为大脑中有两个声音——一个乐观主义者和一个悲观主义者,都在为你提供建议。”Drugowitsch解释道。

当研究人员抑制“乐观”神经元时,小鼠表现出的行为表明它预期的奖励不如之前吸引人;相反,当抑制“悲观”神经元时,小鼠的行为则像预期获得了更高价值的奖励。

“这两组脑细胞共同作用,形成对某一决策所有潜在回报分布的完整表征。”Drugowitsch总结道。

展望未来

研究人员看到了许多未来的研究方向,包括当初始选项的含义存在更多不确定性时,大脑如何做出决策,以及他们的发现如何应用于更广泛的推理领域。

Drugowitsch指出,需要更多的研究来确认这些结果是否适用于人类,并将这些发现适应于人类决策的复杂性。

然而,基于小鼠和人类大脑之间的相似性,他认为这项工作已经为人类如何在决策中评估风险提供了启示,并可能解释为什么患有抑郁症或成瘾症的人群在评估风险时会遇到困难。

通过揭示“乐观”和“悲观”神经元的作用,这项研究不仅加深了我们对大脑决策机制的理解,也为改善人类决策能力提供了新的可能性。

新闻来源:Nature

参考文献:DOI: 10.1038/s41586-024-08488-5

特别声明:[脑机启侦 | 乐观与悲观神经元:大脑如何在决策中平衡风险与回报(02.27)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

她奉子成婚流产无子,前夫再娶小13岁娇妻已育三娃(奉子成婚晋江)

那时,《火线》刚刚杀青,于震在剧组的名声响亮,常常以一条过著称,演戏时不拘泥于角色与人设,人物对戏,情感外露;而方柏霓则是一个新面孔,活泼开朗,爱笑,且敢于顶嘴。她曾尝试复出,但最惨的一次是在横店等了三天,只…

她奉子成婚流产无子,前夫再娶小13岁娇妻已育三娃(奉子成婚晋江)

绿灯都不敢亮了,全因红裙巨乳翘臀太晃眼(绿灯一直不亮)

不需要多余的装饰,冷调的夜色灯光打在红裙上,把她的轮廓衬得愈发撩人,连路边的草叶都跟着沾了点风情。等绿灯彻底亮起,她才踩着高跟鞋👠迈步,裙摆扫过积水的路面,溅起细碎的水花。 她笑着抬手比了个 “嘘” 的手势,…

绿灯都不敢亮了,全因红裙巨乳翘臀太晃眼(绿灯一直不亮)

荒岛囚救》社畜荒岛逆袭惯老板!雷米式「地狱职场幽默」超舒压(荒岛求生 最新章节 无弹窗)

山姆·雷米利用招牌的快速推轨镜头与诡谲节奏,将这对办公室冤家的冲突放大到极致,展现出一种既诡异又无奈、充满「怪诞荒唐幽默」的风格。琳达与老板在岛上的每一场对话,都像利刃般切开职场文化的虚伪外壳,让观众在笑声之…

《<strong>荒岛囚救</strong>》社畜荒岛逆袭惯老板!雷米式「地狱职场幽默」超舒压(荒岛求生 最新章节 无弹窗)

歌手孙悦自曝录制时被冻伤,网友直呼心疼:零下20℃,太冷了(歌手孙悦现况)

观众也换了一茬,但她依然用自己的一套老派方式,默默地证明自己:从不请假、不找替身、不抱怨,甚至为了适应大同的低温,她提前三天自己订了机票,团队事后才知道。那时的冷和如今的冷,虽然隔了三十年,但却如同一条无形的…

歌手孙悦自曝录制时被冻伤,网友直呼心疼:零下20℃,太冷了(歌手孙悦现况)

『机器人』️半马入选!2025年度“十大科技新闻事件”发布(半自动『机器人』️玩家)

1月29日,中国科技新闻学会发布2025年度&ldquo;十大科技新闻事件&rdquo;。中国科技新闻学会副理事长任福君介绍,此次&ldquo;十大科技新闻事件&rdquo;的评选,以重大性、创新性、标志性、

『机器人』️半马入选!2025年度“十大科技新闻事件”发布(半自动『机器人』️玩家)