不少人认为繁衍和死亡是生命必不可少的部分。
然而事实并非如此,因为生命的目的(被动)恰恰就是不惜一切代价的永远生存。但想要生存就需要预测信息(以躲避危险),可想要预测信息就需要学习模型,而个体的死亡正是“想要”永远生存的种群为了学习模型所付出的代价。
违背多数人认知的是,遗忘非但不是缺陷,还是曾允许生命可以不再以个体的死亡为代价来学习的关键。
因为在第二套学习系统中,遗忘代替了个体的死亡(自然选择),起到了筛选模型的作用。
这也是为什么遗忘被称为“神经细胞群的自然选择”(神经达尔文主义由1978年埃德尔曼提出)。
那么 5.7 亿年前的生命是如何构建出这样一套网络学习系统的呢?这套系统又是如何改变整个生物界的呢?
可以明确的是,生命无法一下子形成特别复杂的功能。都是在原有功能的基础上涌现(总体大于个体之和的现象)出复杂的功能。
涌现
比如,草履虫的应激反应就是蛋白质间的涌现。
而演化出真核细胞后的生命一直企图做到的就是细胞间的涌现。
那么随后演化停滞长达十亿年之久的的原因,恐怕正是由极其苛刻的涌现条件所造成。因为要想涌现成新的学习系统,细胞之间不仅要形成稳定的连接,还要有统一的信息交流语言。
而在 6.4 亿年前的埃迪卡拉纪,生命曾有过一种尝试,也被叫做阿瓦隆大爆发(Avalon explosion)。但当时的很多生物如狄更逊水母(Dickinsonia)既没有嘴巴也没有肠道,而是被动的等着海底养分流过,完全不同于今日的动物。
不过却像极了我们的居民楼。这类生物更像是众多细胞的线性聚集,细胞之间相当于独立生存,所以才不得不长成让所有细胞都能充分吸收养分的形状。这和居民都想要采光和通风好的房间一个道理。
然而这类生物虽然形成了稳定连接,却未能达成总体大于个体之和的涌现,并在寒武纪大爆发之前就突然集体消失了。
而几乎就在同一时期,出现了专门用于信息交流的神经细胞和弥散的神经网。
随之而来的就是寒武纪时期的动物集中大爆发。
人类个体也曾经历过类似的模式,花费了漫长的时间才形成了稳定的连接,有了统一的语言,实现了多次涌现,并就在过去的 250 年间(0.01%的时间),集中创造出了人类 97% 的财富。
那么当初这些神经细胞究竟是如何实现稳定连接和信息交流的呢?
经历了一代又一代的变异与筛选,神经细胞演化出一条长长的尾巴,叫轴突(Axon),
能与其他神经细胞的胞体(Cell body)或树突(Dendrites)连接在一起。
同时还有一类叫做胶质细胞(Glial cells)的帮凶支撑和隔离神经细胞并提供养分,也就解决了网络搭建问题。
然而为了形成减熵系统,神经细胞还需要统一的交流语言。
不过之前蛋白质们所达成的涌现,使细胞已经拥有了制造电脉冲的能力。而神经细胞所使用的语言,也正是这种电脉冲的发送频率。
此时每个神经细胞就相当于一个钢琴键。当众多钢琴键以不同的频率共同被弹奏时,就产生了你我所看到、听到、感觉到的各种不同体验。而神经细胞的工作机制也与钢琴键非常类似。
钢琴键被按下之前,都会处于初始状态。
而神经细胞被激活之前,也会处于膜电位(Membrane potential)约在 -70 mV 的初始状态,相当于琴键悬空的那一小段距离。这种初始的膜电位状态叫做静息电位(Resting Potential)。
使神经细胞处于这种初始状态的过程叫做极化(Polarization)。
而促使这一过程的关键是一类叫做钠钾离子泵(Sodium–potassium pumps)的蛋白质“工人”们。这些蛋白质会消耗能量(ATP),通过控制钠离子和钾离子的进出,让膜电位始终保持在 -70mV。
大脑一半的能量都消耗在了这一过程。也就是说,即使什么都不想,大脑也是个“饭桶”,仅占我们身体总重的 2%,却消耗 20% 的总能量,新生儿大脑的消耗更是多达 60%。
钢琴键被按下之后,会带动连锁反应,发出声音。
而当神经细胞被激活后,也会发出一个电脉冲。被激活的条件是轴突与胞体相连处,也叫轴丘(Axon hillock)的膜电位升到 -55mV 。如果没有达到这个阈值, 则不会产生任何反应。
这与琴键需要按下一定的距离才能发声的道理一样。
发送电脉冲的过程是去极化(Depolarization)。
而促使神经细胞产生电脉冲的,是一类叫做电压门控钠离子通道(Voltage-gated sodium channels)的蛋白质“工人”们。
这些蛋白质会在膜电位升到 -55mV 时开门,允许钠离子涌入,使膜电位极速飙升到 +40mV,带动其他部位连锁的去极化,形成动作电位(Action potential)。
一直传导到与其他神经细胞连接处,也叫突触(Synapse)。
而为了加快传导速度,又有一类叫做施旺细胞(Schwann cells)的帮凶们从中作梗,一层一层的包裹轴突形成髓鞘(Myelin sheaths),使动作电位只能在中断的部分又叫兰氏结(Nodes of Ranvier)之间跳跃式传导(Saltatory conduction),把传导速度从10 m/s 增至到了 150 m/s。
钢琴键在发出声音后,需要复位到初始状态,以待下次敲击。
同样的,神经细胞被激活后也需要重新回到初始状态。而这一复位过程也叫做再极化(Repolarization)。
帮助神经细胞复位的是一类叫做电压门控钾离子通道(Voltage-gated potassium Ion channels)的蛋白质“工人”们。这些蛋白质会在膜电位高于 +40mV 左右时开门,允许钾离子涌出,使膜电位迅速下降到低于 -70 mV 。随后再由钠钾离子泵调整到 -70 mV 的初始状态,等待下次激活。
初始,发送,复位,这三个阶段构成了一个完整的“按键”功能,使神经细胞之间有了彼此发送信号的能力。
但却存在一个问题:“按键”发送的信号都是一样的。这就好比所有钢琴键都只能发出一种声音。
可要想形成语言,神经细胞必须要有改变信号频率的能力。
而这一调整就发生在神经细胞之间的突触上。该过程同时涉及到了:运输车,又叫突触囊泡(Synaptic vesicles),送信员,又叫神经递质(Neurotransmitters),和收信员,又叫配体门控离子通道(Ligand-gated ion channels)。
当动作电位传导到轴突的末梢时,会让突触囊泡(运输车)穿过细胞膜,释放出神经递质(送信员)。而在接受信息的神经细胞的细胞膜上,有很多不同的受体(收信员),在与特定的神经递质结合时会开门,允许对应离子通过(或造成其他影响),有的会增高膜电位(激发),有的则会降低膜电位(抑制),影响膜电位累积到 -55mV 的速度,从而调整了电脉冲被触发的频率。
由于调整膜电位的神经递质来自所有与它连接的神经细胞,所以该神经细胞的“按键”是否被按下,是由这些神经细胞所共同决定的。
「完整的按键功能」加上「可调的发送频率」,使神经细胞就可以靠频率来发送不同信息。
好比钢琴键可以发出不同的音调。
这便是首次在前寒武纪所出现的系统。然而它的出现却彻底打破了整个生物界的平衡。
当众多神经细胞一起工作时,就不仅可以传递信息,还可以通过计算,实现任何功能。
比如按这个比例改变频率,就可以实现异或门功能,而按其他频率就可以识别数字。
神经系统出现之前,即使个体演化出了眼睛也无法使用。因为细胞们根本来不及搞清探测到的光子信息意味着什么,信息就改变了。
但有了神经系统后,想演化出眼睛,只要感光细胞(Photoreceptor cell)聚成一排,把扫过的光学信号即时的翻译成电脉冲频率,再经神经细胞群的整合计算,就可以瞬间得出形状和方向等信息。
不仅是反光,任何物理信息都可以被对应感知细胞转换成电脉冲频率,形成能感知外界环境的多维系统(Multi-sensory system)。
而感知系统侦测到的信息,又可以经过另一组神经细胞群的计算,得到实时控制心跳、血压、肌肉等各个“部门”的工作指令,让所有细胞涌现成一种全新的超智能体:
动物完全可以被想象成是一群细胞所驾驶的航空母舰,而促使这些细胞成为一体的,就是神经系统所带来的高速信息交流能力(想象5G普及后会怎样)。
如果向航空母舰里的某个细胞以相同的语言发送信息,就可以获得它的控制权。而如果能阻断细胞之间的信息交流,那就可以彻底杀死整个超智能体。
比如,河鲀毒素就能和钠离子通道结合,阻断发给肌肉细胞的指令,0.5 mg 便可让人死于麻痹(暂无有效的解毒剂)。
这也是为什么英美那么爱干预中国的内政,因为他们根本撼动不了由所有中国人所构成的超智能体。
超智能体
不管怎样,神经系统的出现,使生命首次拥有了实时感知环境,并立刻做出运动反应的能力。
这种感知运动能力使不同个体可以充分洗牌后交配,不必担心近亲交配导致备选模型(个体)差异性不足,而被自然一次性全部筛选掉。
同时也造就了生命史上从未有过的角色:捕食者(Predator)。
捕食者的出现给演化算法引入了巨大的模型筛选压力。这等于给埃迪卡拉纪那些没有保护的软体生物全都判了死刑,存活了下来的,多是不小心变异出甲壳的个体。
又由于捕食者也会因没有捕食利器而被饿死,造成捕食者与被捕食者之间相互的筛选,形成了正反馈循环(Positive feedback),从此再也停不下来了(形成协同演化)。
由“氧”所支撑的高额耗能,由神经系统所实现的感知运动,由“性”所增多的备选模型,由“食”所带来的筛选压力,这一切彻底的引爆了寒武纪的物种演化。
起初生命是对抗熵增的一个奇迹。自此生命是比拼策略的一场游戏。
这恐怕就是寒武纪时期究竟发生了什么。然而这里却存在一个关键的问题:神经系统确实可以靠调整频率实现任何功能,但神经细胞们是怎么知道该如何调整频率才能产生想要的感知和运动的呢?
答案是学习。如果没有学习,上述的一切都不可能发生。
最初的感知与运动,如视觉与心跳,依然是由演化算法,通过个体的死亡,筛选随机变异出的突触而获得的,被称为神经演化(Neuroevolution)。
然而随着运动能力的增强,环境变化速度越来越快,个体生长周期也越来越长,如果还靠个体的死亡来筛选合适的突触,那没等筛选出来,就都死光了(需要个体学习能力)。
而打破这一僵局的是一个细微的演化产物:突触可塑性(Synaptic plasticity)。
突触上的受体不再固定不变,而是可以根据经验自动调节。
比如,长期增强作用(Long-term potentiation)可以通过增多受体数量,加快接受神经递质的速度。
又如,长期抑制作用(Long-term depression)可以通过减少受体数量,降低接受神经递质的速度(甚至屏蔽)。
但二者都对学习有重要作用,不要认为长期抑制作用是抑制学习。因为学习是寻找合适频率的过程,而不是一直增大频率的过程。
这种调节能力就好比按键手机变成了智能手机,可以安装新的 App,无需返场重造。这样即使个体移动到了全新的环境,也可以通过重塑突触而适应,无需死亡。也正是这一特性,使动物个体首次在生命周期内拥有了学习能力。
然而这种学习能力看似美好,却有致命的缺点,也为随后的生命演化埋下了巨大伏笔。
由于个体学习并不像演化算法那样,依靠试错,找出规律,而是总结经验,找出规律。那么就必须要有经验(也就是例子)。这也是从此个体需要记忆能力的原因。好在神经系统既可以学习又可以记忆。
但是总结经验所找出的规律,必须要能预测这些经验之外的情况,否则个体依然会死。也就是说,需要泛化能力(Generalization)。
而泛化能力强的规律是不可能一下子就找到的,跟演化一样,需要不断尝试,不断筛选。而在神经网络中,不断尝试表现出的现象就是:重复(强化使用频率高的连接)。不断筛选表现出的现象就是:遗忘(弱化使用频率低的连接)。
所以遗忘并不是大脑的缺陷,而是筛选规律的过程,是学习的关键部分。
就如同科学家排除不符合实验结果的那些猜想一样。
没有遗忘,个体就不得不靠以死亡为代价的试错来筛选模型。
知道这些后,便可明白为什么《学习观》第一季中反复说:“学习是重塑大脑连接”;“学习要明确输入输出”;“学习要通过多个例子”
如果你只使用现有连接(不改变神经网络),那你大脑的功能根本不会改变。
这也是为什么玩了十年游戏,还是个菜鸡的原因。
如果你选错了输入输出,那你所改变的就是不同感知细胞之间的连接。
这也是为什么若边看字幕边练听力,撤掉字幕就听不懂的原因。
换句话说,想在什么情况下使用,就在什么情况下学习。
同时这还是为什么背诵时要打乱顺序的原因,因为你不想让上一个信息作为下一个信息的输入。
但注意,输入并不是一个神经细胞频率,而是一群神经细胞的频率所共同表达的状态。
比如画面的输入就是整个平面的感光细胞的共同状态。
而如果你没通过多个例子,那你的神经系统就找不到共性,会把知识作为信息遗忘掉。
这也是为什么反复把一个例子背无数遍,还是很快就遗忘的原因。
不过我们可以利用大脑的特性来欺骗大脑。
比如说,虽然用一个例子学习很容易遗忘,但如果你在家里和学校等多个场地,或者课本和科普等多个教材上看到同一个例子,那大脑就会把它作为不同例子来对待。因为不同场所会触发不同的感知细胞,而大脑很容易找到这些感知细胞所接收到的信息的共性。
这种技巧还有很多,会视频更新到演化出的对应功能的位置讲解。
此时生命还没有演化出意识,但我想提一个心理学中经常说的概念:表征。你肯定听过表征(Representation),但你一定不知道它是什么意思,又为什么需要表征。
原因是,这个世界上的猫有无数种形态,你怎么知道你见到了主子?但大脑却能识别出来的原因是不管什么形态的猫都会被神经网络转化成统一的判断结果。
比如,偶数有无数个,但判断一个数是否为偶数时,都会转化成该数除以 2 再取余,这就是表征。我们总是爱问“什么的本质是什么”的原因也在于此。
这同时也是外语(英语)难学的地方。因为所学习的单词的意思不是图片,不是文字(它们都是感光信号),而是大脑内部对该单词的表征。
这种神经系统随后也被我们借鉴到人工智能的研究中,产生了深度学习技术。
「细胞群频率」对应着「向量的数值」。
「非线性函数」对应着「激活条件」。
「可变频的突触」对应着「网络的权重」。
而为了增加泛化能力,也人为的加入了 Dropout 这种遗忘机制。但和生物神经网络不一样的是深度学习是靠反向传播算法调整权重的,因为我们暂时还不知道大脑在分子层级上具体是基于什么原则调整频率的。
2012 - 2017 年就相当于人工智能的寒武纪大爆发。计算机首次获得了感知等级(Perception)的智能。语音,画面等感知都不再是问题了。
但如果你认为这样我们就会被机器所统治,那你也太小瞧生命在随后 5 亿年中的演化了。因为在寒武纪,生命除了感知,还演化出了一个更重要的功能。