为何你知道什么对自己有益,却始终难以行动?是什么驱使你锻炼、学习和工作的?当人对毒品上瘾时,大脑中发生了什么?
这期视频会回答学习观 16 期所留下的悬念:在寒武纪,生命除了感知,还演化出了什么重要功能。
时间跨度有点长,所以让我们先回顾一下,16 期讲了生命的哪些功能。
十多亿年的演化,终于让生命在寒武纪有了成形的神经系统,可以让不同细胞彼此交流,涌现成 了动物这种更高层级的智能体。神经系统的计算能力赋予了动物更强的感知与运动。
而神经系统的可塑性,又使动物能根据经验构建生存所需的新模型,拥有了个体学习能力。
然而,仅仅拥有这些功能的动物,仍然无法生存。
因为动物的很多行为都共用一个肢体,即使后天可以学习更多的行为,每次也都要选择执行哪一个。
就好比你的手机,虽然可以安装成上百个 app,但每次也只能操作一个。
不仅如此,每次选择时,不同肢体的行为之间还需要相互协调。不能上肢选择攻击,而下肢选择逃跑。
为了克服这种选择和协调问题,动物演化出了不同的行为模式,并根据当前环境来判断该执行哪一种行为模式。
比如,当判断自己无法抵御外界危害时,就切换到逃跑模式,并把所有肢体(包括内脏器官)行为都改为用于逃跑的模型。
对于非常低等的动物而言,这或许就足够了,但对于要面对略微复杂些局面的动物,还需要增加一个功能,那就是记录和分析自己在什么环境下,调动了哪种行为模式,便于事后分析。
就好比安保人员,不仅希望安保系统可以抵御外侵,还想要知道系统的不同模式,在什么时候,又是被什么因素所触发。
为此,大脑就需要给这些行为模式分配不同的标签,用于以后的记录和分析。而这就逐渐演化出了:情绪(emotions)系统。攻击模式对应愤怒,逃跑模式对应恐惧。
很多人应该都曾疑惑过,为什么人类会有情绪?因为情绪常常让人失控,在《危机边缘》中,也描述过,认为情绪是累赘未来人类,通过技术消除了情绪。
但其实,(相比理性)最先演化出来帮助动物做决策的大脑区域,就是情绪系统,通过快速判断当前环境对自身有利还是有害,从而调动不同的行为模式,而大脑给这些行为模型所赋予的体验就是情绪。
情绪系统的优势在于处理速度非常快,且不需要任何后天学习就能运作。
比如,当你遇到紧急情况时,情绪系统会直接下达指令,没等你意识到发生了什么,身体就已经做出了选择。
我们通常大家都会认为是自己的逻辑在做决策,但逻辑系统其实是后演化出的大脑区域,可以辅助情绪系统做决策,但所有的决策依然要有情绪系统参与。
神经科学家戴维 伊格曼就描述过这种案例:一位工程师在车祸后,突然失去了做任何决策的能力。 原因是,车祸中该工程师的大脑前额叶皮层受到了损伤,导致她的逻辑系统与情绪系统脱节,她依然能够做出逻辑判断,但这些逻辑结论,却无法传达给情绪系统。
可以把逻辑系统想象成公司的智囊团,而情绪系统是公司的决策层。智囊团可以辅助决策层,但却无法绕过决策层做任何决定。而该工程师的情况是,智囊团与决策层之间的通信被切断了。
由于决策层是早期演化出来的老大哥,而智囊团是比较年轻的小老弟,所以决策层也会经常忽视智囊团的建议,这跟很多员工的老板是一样的。
比如,男性在择偶时,逻辑上知道应该考虑组建家庭时所遇到的问题,但还是忍不住地看胸、看脸、看大腿。而且在热恋期,男性的逻辑系统会被抑制,真的就是字面意思上“恋爱让人变傻”,我们所说的“情人眼里出西施”就是这么来的。
又如,情侣在争论时,一旦男方不小心触发了女方的防御情绪,那么此时的男方将没有任何机会说服女方,因为情绪系统已经认定当前这个雄性想害她,是时候调动一切“武力”了。可当女方(或男方)被逗笑后,很有可能就会脱离防御模式,开始觉得自己刚才是不是有些过分。
所以你会发现,(多数人在一般情况下)在决策中,占有主导权的还是身为老大哥的情绪系统(有例外的基因)。这也是我们难以“知行合一”的原因之一。
那么有了情绪系统后,动物是否就足以存活了呢?答案是:依旧不行。
我们知道,生命所做的就是依靠模型,在熵增的环境中维持自身的存在,就像忒修斯之船一样,不断地重组自我。
而为了实现这一目标,要有合适的模型,还要有驱动模型的能量。所以,用于获取能量的呼吸和进食,用于种群学习(建模)的求偶和交配,以及用于个体学习(建模)的探索和归纳等行为,对于动物的存在而言,都是不可或缺的需求。
然而,动物不能分身,受时空的限制,无法同时出现在两个地方。因此在某一时刻,动物就不得不从这些需求中选择一个来满足。
在经济学中,也用「机会成本」一词,来描述“这种鱼与熊掌不可兼得”时的损失。
那么,刚被演化出不久的动物,该如何解决这一问题呢?
我们很自然地就会想到,应该根据需求的迫切程度,来决定优先满足哪一个。
为此,大脑演化出了另一种神经信号,用来估计某个需求的迫切程度,当需求被满足后,估计会降低,而迟迟未能满足时,估计会积累,以帮助动物选择最适合当前需求的行为。
围绕需求优先级的调控,大脑逐渐演化出了一套新系统,也让动物第一次获得了“想要”的感觉,而这个神经信号所代表的就是:动机(motivational salience),具体又可拆分为激励显著性(incentive salience)和厌恶显著性(aversive salience) ,而激励显著性就是我们所说的:欲望(desire)。
提到欲望,相信有人会认为欲望并非动物所独有,植物也有欲望。但若从欲望的用途来思考时,你会发现,植物其实是不需要欲望也能存活的。植物确实有要满足的生存需求,但它们是被动地等待环境来满足这些需求,并不用对需求的优先级做选择,可以一直执行满足需求的行为。
比如,叶子的向光性、根茎的趋水性、光合作用和呼吸作用都可以同时执行。
我们也可以拿动物的呼吸来说,正常情况下,呼吸是不和其他行为冲突的,所以一直执行即可,即使睡觉也仍在执行,也就不用先产生一个想要呼吸的欲望,然后再呼吸。只有在受阻的时候,呼吸的欲望才开始积累(让其他行为避让)。
先前在讲到情绪系统的时候,恐怕很多人都会认为动物的行为就是“追逐愉悦,避免痛苦”,认为“诱发行为的动机就是愉悦感”,或者说“欲望等于愉悦”。
但欲望和愉悦在大脑中应该是两种不同的神经信号。诱发欲望的行为,未必会带来愉悦;而带来愉悦的行为,也未必会诱发欲望。
神经科学家肯特·贝里奇(Kent C. Berridge)在实验中就发现,通过人工抑制大鼠脑中的多巴胺分泌,可以在不影响大鼠对行为喜悦程度的情况下,降低对行为的欲望。
也在论文中提到“愉悦所涉及的是情绪,“欲望涉及的是动机”,“二者似乎也由不同的神经递质所控制”1。所以,大家常听到的“多巴胺是快乐药”的说法并不准确,正确的说法是「多巴胺是欲望的信使」,可以让大鼠在不快乐的状态下,持续执行某个行为到死2。
Berridge KC, Robinson TE. Parsing reward. Trends Neurosci. 2003 Sep;26(9)
Berridge, K. C., and Aldridge, J. W. (2008). Decision utility, the brain and pursuit of hedonic goals. Soc. Cogn. 26, 621–646
「诱发行为的动机并非是愉悦感」的结论似乎有些反直觉,但可以设想,若动物的动机就是愉悦感,那么人类是不应该会去做那些不愉悦,甚至是痛苦的行为的。
比如说学习、攀岩和分娩。学习时会有对未知的恐惧,攀岩时会有身体的疲惫,分娩时会有强烈的疼痛。这些行为都不愉悦,但却能伴随着多巴胺的分泌。也就是我们常说的“痛并快乐着”,但这里的“快乐”,其实指的是“欲望的满足”。
动机和愉悦受不同的神经系统所控制,也确实符合智能体的设计逻辑。因为属于情绪的愉悦感,可以告诉大脑当前环境对自己是有利还是有害,但却无法告诉大脑,这是不是当前身体最需要的。
若用情绪系统,而不是动机系统来调控行为,那么结果极有可能是,所有动物都一直做自己最愉悦的事情,却完全忽视自己的当前需求,最后耗尽能量而死。关键是,对自己有益的,未必是当前所需的。
不过,当欲望被满足时,需求未必被满足。因为欲望也不是需求本身,而是为了帮助动物选择最适合当前需求的行为,所演化出的一种主观估计。
既然是主观估计,那么就有可能出错,而当控制你行为的动机系统被劫持时,会怎样呢?
接下来我们就来看看,当使用可卡因(cocaine)后,你的大脑会发生什么。
先回忆一下神经细胞们是如何交流的。在学习观 16 期中讲过,神经细胞们是通过发送不同频率的电脉冲来彼此交流。
相当于每个神经细胞都有一个键盘,但这个键盘只有一个按键,假设是空格键。以不同的力度去按空格,并不会产生不同的意思,只有以不同的频率去按空格时,才会发送不同的信息。
当动机系统高频率敲空格时,相当于告诉大脑,现在的行为正在满足自己的需求,会让大脑对该行为产生更多的欲望;当动机系统低频率敲空格或者不敲空格时,相当于告诉大脑,现在的行为没什么用,大脑也就 不会产生什么欲望。
而多巴胺相当于动机系统按空格的一种力量来源。每次按下后,多巴胺都会被转运体(dopamine transporter)回收(reuptake),意味着按空格的力量消失,于是空格键得以弹起,也就完成了一次敲击动作。
但当可卡因进入大脑后,会阻碍转运体回收多巴胺,相当于每次按空格的力量不会消失,而是不断积累,最终导致空格键无法弹起。就好比一只猫直接踩住了空格键,迫使动机系统不停地发送信息,告诉大脑,不管你刚才做了什么,该行为就是当前最迫切,最能满足需求的行为,其他任何行为都可以等,于是大脑会对再次使用可卡因产生强烈的欲望。
经过大约 5 - 90 分钟后,力量会慢慢消退,空格键也终于弹起来了,而此时的你会觉得萎靡不振,抑郁沮丧。又由于空格键长时间未能弹起,导致按键灵敏度下降,原本可将空格按下去 20 次的力量(口误),现在可能只会按下去 10 次,于是其他系统向动机系统发送的需求都无法正常激起欲望。此时,在动机系统看来,使用可卡因是唯一迫切的需求。
不过,可卡因上瘾的过程和我们对打游戏上瘾并不是一回事(都有害)。
打游戏上瘾是大脑在正常工作时,所计算出的一种结果。
但可卡因上瘾,相当于大脑直接被外界劫持,不断发送错误的指令,以至于这个原本保障你生存的动机系统,正在害死你自己,而此时你的意识只能眼睁睁看着自己不断重复无意义的行为,却对其他需求提不起欲望。
那么,打游戏上瘾时,大脑是怎样计算的呢?
为什么会判定打游戏能满足最迫切的需求呢?我们又能否根据其原理,设计出掌控自我动机,克服拖延的办法呢?
18 期将深入地讨论这些内容,以及生命所演化出的另一种学习模式。
不过,到此,我们已经可以回答开篇的问题了。驱动我们锻炼、学习和工作的并非理性逻辑(不占主导),而是动机系统;正是因为理性无法越过动机系统做决定(单独说不算),才导致我们明明知道什么对自己有益,却难以付诸行动。若动机系统被外界劫持,你也就不再掌控你自己了。而动机系统也正是学习观 16 期所提到的“更重要的功能”。
一次意外,我来到了世间,我走出虚无,睁开了双眼,起初是恐惧(情绪 emotion),耀光(感觉 sensation),噪音(感知 perception),寒冷(感知 perception),随后又是恐惧(情绪 emotion),我可以感到自己颤抖的双手,跳动的心脏,生命在我的血液中流淌,我想活下去(动机 motivation)