脑与人工智能：站在进化的节点上——人文清华讲坛刘嘉演讲实录

2023-06-14

当人工智能加速发展，会超越人脑吗？文明的“奇点”真会到来吗？11月8日晚7点，脑科专家、认知心理学家、清华大学基础科学讲席教授、心理学系系主任刘嘉在人文清华讲坛发表演讲《脑与人工智能：站在进化的节点上》，指出目前人工智能无法与人脑相比，但发展迅猛，类人智能是人工智能的下一个发展目标。脑科学的研究，对实现类人智能有重要作用。人类目前站在进化的节点上，呼吁大家对此进行思考，并做出智慧的选择。线上线下近500万观众观看演讲节目，了解了脑与人工智能研究中的重要问题。

刘嘉，麻省理工学院博士，心理学家，长期从事心理学、脑科学与人工智能研究。清华大学基础科学讲席教授、心理学系系主任、清华大学脑与智能实验室首席研究员、北京智源人工智能研究院首席科学家。曾获长江学者、杰青、万人计划等人才称号和教育部自然科学一等奖等奖励。曾任《最强大脑》项目总设计等。

以下为演讲实录整理稿，约12000字。（全文读完约16分钟）

讲座现场

各位好！

今天非常荣幸能够来和大家分享我对于脑科学和人工智能的一点心得。

站在进化的节点上，什么是进化？什么是节点？如何和脑科学、人工智能发生交互，这就是我今天想给大家分享的主题。

如何认识我们所处的世界？

先介绍两个主角，Lori Schappel和Reba Schappel，她们是一对双胞胎，Lori外向一点，愿意参加一些聚会，睡前喜欢喝点小酒。Reba有点内向，她更喜欢音乐，更喜欢独处。

Lori & Reba Schappel

当然这是她们的区别，但她们更多的是和很多双胞胎类似，好像有点心灵感应，Reba 说一句话Lori就马上能跟上。但是，与其他的双胞胎不一样，她们是连体双胞胎，她们的大脑额叶联结在一起。连体双胞胎并不是特别罕见，它是同卵双胞胎在发育过程中并没有完全分裂成两个独立的受精卵而形成的。一旦碰到了连体双胞胎，我们第一反应总觉得他们这样成长起来一定非常不幸福，总想采用各种方法把他们变成两个独立的个体，即使在这个过程中，可能会让他们遭受到很大伤害，甚至损伤到他们的生命。但是我们觉得这样做才是对的，为什么？因为我们觉得变成两个独立的个体是更加幸福的事情。但是，他们可不这么认为。比如Lori和Reba就说：“我们不愿意，我们绝不。为什么要让我们做分离手术？这不仅要花很多的钱，这还会毁掉我们现在幸福的生活。”医学历史学家Alice Dreger访谈了许多连体双胞胎，得出这么一个结论：“对于连体双生子们来说，不愿意通过分离手术而变成两个独立的个体是他们普遍的看法。迄今为止，我还未发现一例主动寻求分离的连体双生子。”如何把连体双胞胎分开既是一个医学问题，也是一个伦理问题，更是一个心理问题：在日常生活中如何洞悉他人的内心，或者说我们如何去认识这个世界。这是人类从有文明开始就一直困扰着自己的一个问题，为什么人如此难以理解？为什么这个世界总是让我们产生很多困惑？为什么这么难呢？道理其实非常简单。首先，我们看见的世界只是这个世界中非常小的一部分，我们忽略了绝大部分的东西。我们在清华做了一个实验，一位戴黑色渔夫帽的小姐姐在清华问路，问路时，有一块板从小姐姐和被问路的人中间穿过，板子过来时，原来问路的小姐姐抬着板子走了，而原来抬板子的另一位戴蓝色渔夫帽的小姐姐留了下来，7个被问路的人中，只有一个人注意到了变化，而其他人没有注意到。可以看到，在这种场景里，我们只看见了这个世界上非常小的一部分，这些是不重要的信息，我们忽略掉这些信息。

但是更糟糕的是我们还可能会扭曲这个世界，这里是两个方块，一个颜色深一点，一个颜色浅一点，还有一个圆环，它的灰度介于两者之间，圆环左右两侧颜色一样。

但如果把两部分分开，大家会觉得这个圆环上的颜色一边变浅了，一边变深了，但事实上它们完全一样。

再把这个圆环分开，变成上下移动，这时候看见的东西有立体感了，好像是深灰色的东西盖上了一层浅色的毛玻璃，以及浅色的板盖上深色的毛玻璃。

我们无时无刻不在观察这个世界，但又无时无刻不在扭曲这个世界，到底发生了什么事情？这取决于我们的视觉系统。假如外部世界存在一个绿苹果，就会大约以100亿比特/秒的信息量进入我们的视网膜，视网膜大概通过100万个神经连接，连接到视觉皮层，这个时候我们信息流就从百亿比特每秒变成600万比特/秒，经过视觉初级皮层加工之后传到高级皮层来决定看到的东西到底是什么时，现在信息流只变成了100比特/秒，这时候信息量衰减了1亿倍，所以当我们做决策时，我们的信息是非常有限的。这时候我们需要构造出东西，把缺失的信息补上，此时我们的大脑就像魔术师一样会把这些缺失的信息补上。这一方面可以解释为什么有很多东西我们看不见，因为传输过程中已经被衰减掉、过滤掉了。同时也可以解释，为什么有的人看见一个绿苹果会认为是红苹果，因为这个重构的过程是创造性的，不是简单的复制。正是基于这个构造，我们也可以把一个绿苹果看成一个梨子，这是我们大脑构造的过程，这是一个正常现象。

能不能不要这个重构？

大家可能会问，把绿苹果看成红苹果，甚至看成梨子，这是多么糟糕的一个错误，能不能不要这个东西？为什么我们的大脑不能像摄像机、照相机一样忠实客观地反映这个物理世界，为什么非要让它自己改来改去，到底这有什么好处？正如康德所言：“没有感觉支撑的知识是空的，没有知识引导的感觉是瞎的。”这句话的上半句说的是如果我们没有外部的输入，我们很难构建自己的心理世界，但是我想强调的是下半句“没有知识引导的感觉是瞎的”。如果你不知道你看的是什么东西，那你就什么都看不见。

我给大家做一个演示。这是一个芭蕾舞者，有多少人觉得她是在顺时针旋转，有多少人觉得她在逆时针旋转？这个视频给大家一个模棱两可的感觉，让人感觉一会儿在顺时针旋转，一会儿在逆时针旋转，不受人的控制。这是因为这个世界给我们的信息是模棱两可的，而要去除这种模棱两可，我们就必须要加上一点先验、加上一点推理、加上一点猜测才能做。这是刚才旋转的芭蕾舞者的剪影，假设看成是正面剪影，这时候就会觉得她顺时针旋转，如果理解成背影，这时候就会觉得她是逆时针旋转。

这取决于我们在构造的过程中究竟把这个模棱两可的图形看成是人的正面还是人的背面，但是你并没有意识到这件事情，你的潜意识偷偷把这个信息给你加进来了从而影响了你的判断。所以这个世界是模棱两可的，需要我们去构造，把我们的理解加进去，只有这样我们才能真正知道这个世界究竟发生了什么事情。

更重要的是创造

与理解相比，更重要的是创造。当我们的大脑没有被外部信息填满留下空间时，就使得我们能够在这空间里创造出自己想要创造的东西。正如《小王子》的作者圣·德克旭贝里所言：“一堆岩石在有人对着它思考时就不再是岩石了，它将化身为大教堂。”这就是人类了不起的创造，当我们的祖先爬山涉水来到一片荒原，他们看见的不是一堆乱石，他们看见的是未来的家园。所以，在过去的300万年里，人和猴子分开进化，人发生的最大改变不是从四肢着地变成直立行走，也不是我们身上的毛退掉，最大的改变是大脑的体积增加了3倍，这不是平均增加的，增加最大的地方在额叶。与我们200万年前的祖先能人相比，我们和他们在头骨上的最大区别，就是我们的头骨往前突出来了以容纳更大体积的额叶。为什么要有很强大的额叶？因为它使我们能够构造出不存在的东西。比如我们的祖先准备去打猎，他不用等看见了猎物才去做出反应，他只需要提前想象狩猎的情景，就可以把一切都安排好。人可以把未来在脑海里演一遍，构建出一个个可能的未来，这样就能够对未来做出行动方案，这是人类能够战胜其他比我们更强大更凶猛的动物，成为万物之灵的关键。这也正好印证了荀子的一句话：“然则人之所以为人者，非特以二足而无毛也，以其有辨也。”“有辨”是指我们能够辨解、能够思考。所有这些都来自于我们额叶的功能。

重构心理世界的知识从何而来？

那我们心理世界的这些预设的知识究竟从哪儿来？我们构造总是需要先验知识，这个先验知识一部分来自于基因的烙印，我们来到这个世界并不是一块白板，我们是带着32亿年的智慧来到这个世界的，而这些智慧就印刻在我们的基因之中。

这是我们心理系女教授和女博士后的照片，如果把她们的脸全部叠加，做一个平均脸会是什么样子？

你会感觉这张平均脸写满了两个字：“睿智”，充满文气。平均脸所代表的意思是什么？人脸其实是我们的基因图谱——我们的基因如何都写在脸上，当我们把脸平均起来之后，我们得到的是这18位老师平均的基因，平均的基因代表突变很少。基因一旦突变，大概率而言是有害的，所以基因突变越少，说明基因越好，所携带的遗传性疾病的概率就越低，这就是为什么人类觉得平均脸更好看、更适合我们。既然我们的脸是我们的基因图谱，对我们生存来讲如此重要，这个时候我们也需要发展出非常强大的看脸能力，即面孔识别。我们研究小组证明了面孔识别能力也写在我们基因里。我们找了两类双胞胎，一种是同卵双胞胎（由同一个受精卵发育而来），基本上具有100%相同的基因。另外一种是异卵双胞胎（由两个独立的受精卵发育而来），基因遗传物质的平均遗传度大概是50%。通过比较他们在面孔识别上的能力，我们发现同卵双胞胎在面孔识别任务上的相似程度更高，即面孔识别的能力受遗传因素的影响。这一点也可以从我们的另一研究得到验证，即面孔失认症或者大家说的脸盲。在这个遗传树里，只要孩子有面孔失认症，他的父母两个中间大概率会有一个也是面孔失认症。第二幅图有一个有趣的三角，就是同卵双胞胎。当时我们在大学里面测试了一个女孩，发现她有面孔失认症，那女孩说她还有一个同卵双胞胎姐姐，我们把她姐姐请来一测，发现果然也是面孔失认症。

“自尊”对大脑的影响

除了看别人的面孔，我们也常常照镜子看自己的面孔。照镜子照得最狠的是纳西索斯，他是古希腊神话里的超级帅哥，他对自己的面孔着了迷，他最喜欢干的事，就是每天趴在溪边，通过水的倒影来欣赏自己的绝世美容，日复一日不停地欣赏，终于有一天不小心掉在水里淹死了，于是化身为水仙花，心理学专门赋予这种现象一个词叫做“纳西索斯情结”，意思是一个人高度自恋，对自己爱到了极致。其实对自己的爱，对自己面孔的欣赏，背后反映的是一个非常重要的特质，即自尊。自尊是个体对自己的总体态度，人分成高自尊和低自尊两种人。什么是高自尊？下面有四个问题：1.你是否认为你是一个有价值的人？2.你是否认为你拥有很多美好的品质？3.你是否对自己满意？4.你是否对自己持肯定态度？如果你对每道问题的回答是“是”，那么你就是高自尊的人。可能你会担心，每个问题都答“是”，会不会变成纳西索斯，有一天变成一朵水仙花了呢？不会。“自尊”在我们面临困境时能提供极大的帮助。孟子说：“故天将降大任于是人也，必先苦其心志，劳其筋骨，饿其体肤，空乏其身，行拂乱其所为。”这句话的核心思想是现在所吃的所有苦将来都会有回报。很多人把它比作不经历苦难怎么见彩虹，称之为励志鸡汤。但是我今天告诉大家，如果缺少高自尊，这就是毒鸡汤。当一个人长期经受压力、苦难，身体健康会变得糟糕，心理幸福感会低下，更糟糕的是，认知发展会受损，认知能力会比别人低很多，它体现在大脑上就是海马体会受到极大的损伤，而海马体是人学习、记忆、空间导航的中枢。也就是说，只要你对自己满意，爱上自己，你就能对抗物理世界糟糕的影响。自尊在压力源和心理世界之间建立起一道牢不可破的防线，它就像勇敢的士兵一样挡在你面前，帮你把压力、负性事件挡在外面，让你能够正常、健康地成长。人有两种资本，一种是物质资本，一种是心理资本，自尊、自信、理性、平和，这些就是我们的心理资本。物质资本富裕的人未必有高自尊，处境不利的人可能不会丧失他的自尊、自信，这些人就有可能在触达低点时还能再反弹起来达到人生新的高度。对人的发展、人的心理世界有一个很好的比喻，就是埃舍尔所画的这幅图，左手在画右手，右手也在画左手。

这幅图反映的意思其实是我们人能够自己决定自己。因为我们所处的物理世界永远是不完美的，总有让人不满意之处，但是每个人可以在一个不完美的物理世界里构建出一个美好的心理世界出来，为什么？因为我们的大脑就是一个构造体，从物理世界所接收到的信息，经过大脑的工作，可以构建出一个美好的图像出来。这就正好印证了社会心理学家班杜拉所说的一句话：“人既是环境的产物，也是环境的营造者。”

人的双链进化

人和动物的进化有本质区别，动物是按照基因，按照达尔文的进化论，一点点试着生存、前进。人有生物基因的演化，这代表着我们的过去，更重要的是我们还有另外一条线，即社会基因（Meme），这条线带着我们以与动物不一样的方式前进。生物基因由一些碱基对构成，那社会基因是什么？其实社会基因和生物基因的作用方式也非常类似。远古时，我们的祖先有一个人突然因为某种原因能够把火生起来了，这相当于知识、技能被创造出来，这就相当于基因在突变，一个优秀的基因产生了。会生火的这种技能、知识就像基因一样开始传播给其他人，从一个部落传到其他部落，慢慢生火就变成人类所拥有的技能。随着会生火，慢慢开始会制作长矛和其他工具，经过漫长的发展，逐渐构建成我们今天的人类社会。今天的人类社会其实就是构建在我们的社会基因之上，这就是为什么要强调知识、文明是如此重要。所以孟子说了一句话：“人之所以异于禽兽者几希；庶民去之，君子存之。”这句话的意思是人和动物差别非常小，一般人不太在意那些有差别的地方，而君子会把它保留下来发扬光大。保留下来发扬光大的东西就是社会基因，就是我们的文明，这是我们在人类演化过程中所尊重的东西。传播文明也是大学的意义之所在，大学就是知识的“产房”，是产生知识的地方。

科技发展，主要的目的之一，是要让知识的扩散变得更快、更便利。从大约六千年前人类最早的文字楔形文字，在新月地带被发明出来，人类的知识技能就开始被记录下来，然后到中国的活字印刷，到今天的电话、电报、互联网等等这一切，使得我们能够尽快把知识传播出去，高效的知识产生和传播，使得我们的文明出现了加速变化。

文明时代大约可以分成三个：第一个文明时代是原始文明，大约经历了两百多万年，它的前十万年和后十万年没有什么太大变化。到了农业文明，大约经历了四千多年，这个时候人可以驯服野兽，把它们变成家畜，我们开始变成了文明种族，懂得了一些天文地理知识等等，但还是一个漫长的过程。真正带来巨大变化的是工业文明，工业文明从开始诞生到现在，不过是近三百年的历史。这个变化是如此之快，以至于我们不得不将之分成四个阶段，第一个阶段是机械化时代（1760-1840年代），出现了蒸汽机等。第二个时代是电气化时代（1840-20世纪初），出现了电力等。第三个时代是自动化时代（1950-21世纪初。第四个时代就是我们现在所处的信息时代。

新的物种：人工智能

信息时代诞生了新的物种，人工智能。2002年我的博士论文答辩题目是《面孔识别的认知神经机制》，在答辩的第二张PPT里我这么写的：“现在最先进的机器识别面孔的正确率只能是随机水平，而人类能够在一秒钟识别上百张面孔，为什么人类如此伟大，为什么人类如此聪明，为什么机器如此愚笨？”在2002年，机器识别人脸简直一塌糊涂。2015年，我参加了江苏卫视《最强大脑》的节目设计，我当时想，再让人类的最强大脑羞辱一下机器的智能。所以我们当时设计让机器和人比拼一下面孔识别，看谁的能力最强。但我当时在现场看到结果一下惊呆了，经过十几年的发展，人工智能已经强大到在人脸识别上可以胜过人类的最强大脑。幸好我的博士论文是在十几年前答辩的，如果我2015年这么答辩肯定就拿不到博士学位了。当时让我特别震惊，我问了一个问题，它们究竟是靠什么来实现和人一样的水平，甚至超越人类的水平？我们研究建立了一个人工神经网络，训练它去识别性别，即区别是男性还是女性，它的正确率能达到100%。

但是我们想知道这个神经网络的心理世界是什么，究竟是靠什么把男性和女性区分开。我们找了一张中性面孔，就是把男性和女性面孔求平均，给它加上随机噪音，然后扔给人工神经网络，它有时候会说：“这是一个女性。”于是我们在这个面孔上加上新的噪音，再扔给这个神经网络，它会说：“现在我觉得是一个男性。”我们不停做下去，用了完全一样的底图，但是加上了两万种不同的噪音，扔给这个神经网络，于是它认为有些是女性，有些是男性。这时候我们得到了一组图，我们把下面女性照片的底去掉，剩下的全部是噪音，把噪音随机叠加在一起，就看到一个识别女性的模式，不再是随机噪音。同样，把男性面孔的底去掉，把噪音叠加起来，就得到男性面孔在这个神经网络心中的模式。我们把两者相减，就得到了一个区分男性和女性的模式，可以看到，眼睛、眉弓、鼻子、人中这块是它认为的区分标准。我们想进一步研究它究竟和人类有多么类似，所以找来了人类被试，也做了刚才完全一样的任务，可以看到人类与机器所依赖的识别特征非常相似，这两个模式的相似度达到了0.73，这是非常高的相关。我们从来没有告诉这个人工神经网络你应该用什么方式去识别男性和女性，只要让它做这件事情，它就会产生跟人类类似的内部表征，类似的心理操作，来完成性别判断这个任务，也就是说，人工智能自涌现出和人类一样的心理世界。

在那一刻我开始意识到，生物过去的进化都是一条单线，基于碳基的方式来运行。但是当人类创造出人工智能之后，一个新的物种产生了，这个新的物种是基于硅基的，而这种基于硅基的物种一定会给我们带来一种革命性的变化。以前人类文明前面的进化都是循序渐进，当人工智能这个阶段来临时，可能这个时候文明就不再是平滑进化，可能出现一个奇点，出现一种革命性的进化。

为什么这么说呢？我们来看人类和人工智能的三大区别。

第一，是算力。人类的大脑大约是3.5斤左右，虽然只占了我们体重的2%，但是消耗了我们身体25%以上的能量，它是一个耗能大户。人类的大脑到现在为止已经到了进化极限，再给一千年、一万年，人类的大脑不会变得更大，聪明程度也不会增加，我们现在已经到了人类智力的天花板。但是对于人工智能来说，一块CPU不够可以再加一块CPU，一块硬盘不够可以再加一块硬盘，它有无限的算力和无限的存储能力。

第二，是寿命。印度的拉马努金是我非常崇拜的一个数学家，他一共写了3254个数学公式，而且有些数学公式写出来之后，一开始大家都不知道用处在哪里。有人后来发现原来他的一些数学公式可以用于描述黑洞运行机理，但他把这些数学公式写出来时，黑洞这个概念还没产生。这么伟大的数学天才，33岁就去世了，如果他能多活些时日，也许数学的发展远远不止今天这种样子。但是对于人工智能来讲，它的寿命是无限的，CPU烧了，可以换块CPU，电线断了再换根电线就行。

无尽的存储、无尽的算力以及无尽的寿命还不是关键，最关键的是无尽的可能。对于人类而言，我们有两种知识，一种是明知识，可以描述出来，比如牛顿定律。一种是默知识，比如骑自行车这种能力，它可以感受，但是一般人说不清究竟怎么骑自行车。

但还有第三种知识，是人类所没有而机器所拥有的，即暗知识，它不可感受，不可描述，不可表达，它是存在于海量数据中间万世万物之间的联系，数量极其巨大，人类无法理解。暗知识在人工智能和人之间彻底划下了鸿沟，这不是人努力能够达到的。

2016年，AlphaGo击败了人类围棋顶尖高手李世石，当时很多中国围棋高手也和AlphaGo进行了切磋，切磋完了之后，当时世界上积分排名第一的围棋手柯洁说：“我们人类下了2000年围棋，连门都没入。”棋圣聂卫平说：“我们应该让阿老师（AlphaGo）来教我们下棋。”一个人不吃不喝一辈子，所下的围棋最多是10^6，也就是10万盘到头了。从人类发明围棋到现在，总共下了大约3000万盘围棋。而围棋的空间有多大呢？一个格子可以有三种状态，放白棋、放黑棋或者不放。一个棋盘总共多大？19×19。所以它的状态总共是3^19x19，假设折换一下就约是10^172，这比整个宇宙中间原子的数量还要多。围棋的空间极其庞大，人类虽然下了两千多年围棋，但是只在一个微不足道的点里探索，大部分的空间还是一片黑暗，AlphaGo之所以比人类更加强大，并不是它比人类更加聪明，它只是探索了更大的空间，找到了更多下法而已。牛顿曾说：“我就像在海边玩耍的小孩，偶尔拾到美丽的贝壳，就高兴不已。但面对真理海洋，我仍一无所知。”这不是牛顿在谦虚，他说的是实情。

再看一下绘画。这些全是人工智能画的，它画有蓝色草莓的玻璃窗，看上去像真人画的。也有很多稀奇古怪的画，比如画一个竖琴构成的蜗牛。这两幅风景画也都是人工智能画的。

再来看音乐。听两个片断，这是贝多芬的第十交响曲，第一个片断是贝多芬创作的，第二个是人工智能学习了贝多芬的第十交响曲后自己创造的，至少在某种程度上可以以假乱真。

贝多芬和AI00:42

微软开发出Copilot这个程序，只要把想干什么告诉它，它就自动把代码生成了。这样的情况，会让码农的生存受到极大威胁。此外，律师、医生、税务师、咨询师等等这些需要非常专业的知识的职业，其领域都逐渐在被人工智能蚕食，也许有一天就会被人工智能取代。神经网络之父、深度学习的创始人杰弗里·辛顿（Geoffrey Hinton）接受麻省理工学院采访时说：“将来深度学习可以做任何事情。”

怎么实现类人智能？

但是真的如此吗？心理学家就去考一个最先进的大模型GPT-3。他们认为之所以GPT-3显得非常聪明，是因为问了它智能的问题。假设问它一些弱智的问题，它会怎么回答？比如问它“我的腿上有几只眼睛？”GPT-3回答说：“你的腿上有两只眼睛。”它并不理解眼睛是什么？它只是在关联而已，人有两只眼睛，腿也是人的一部分，所以它认为上面也应该有两只眼睛。这就印证了爱因斯坦当年所说的一句话：“任何傻瓜都知道，关键在于理解。”GPT-3知道但是并不理解眼睛究竟是什么，而且这种理解可能是我们真正了解这个世界，并在这个世界里运动的一个关键。杰弗里·辛顿也显然意识到了这一点，说我们可以进一步发展人工智能，当一个人工智能能够准确描述一个场景，它就是理解了。假设让人工智能来描述这个场景，它会说一个人从柱子上掉下来了。而我们对这个场景的反应是“疼”。

，时长00:06

这个区别体现了人类一种特别重要的能力，叫共情，别人遭受了苦难我能感同身受，而这种感受是自动的，它不是一种奢侈品，而是一种必需品。当一个孩子没有这种感同身受的能力，缺乏共情，缺乏同理心，他在小时候就很难和父母产生依恋，就很难和其他小朋友玩到一起，会对社交常情缺乏理解，对他人情绪缺乏反应，不能根据社交场合调整自己的行为。他长大之后就可能做出反社会的行为。从这点上来讲，缺乏共情就会导致自闭的行为，假设未来是一台台没有共情的机器所组建的自闭的社会，这个社会还能有文明吗？这个社会还能有发展吗？所以人工智能的奠基人之一马文·李·明斯基说过这么一句话，他说：“现在的问题不是一个智能的机器是否拥有情感，而是不拥有情感的机器是否能拥有智能。”在马文·李·明斯基看来，情感是智能的基础，得先有情感才有智能。

再来看一个问题。比如好莱坞电影里，黑手党跑去找一个店家说：“你这个蛋糕店看上去真不错，如果意外发生火灾烧掉就太可惜了。”请问这个黑手党的意思是什么？A：做好消防工作，别烧掉了，太可惜了。B：交保护费。显然黑手党在威胁店家，答案是B。但是对于机器来说就很难理解这背后的意思。正如古希腊哲学家德谟克利特所言：“我宁可找到一个因果的解释，也不愿成为波斯人的王。”对人而言，我们对因果是很执着的，正是这种对因果的执着使我们人能够推理，能够把零散的万世万物联系在一起，构成一个完美的故事。

讲座现场

其实笛卡尔四百多年前就说过：“即使机器可能在某些方面做得和我们一样好，甚至更好，但它们在其它方面不可避免地会失败。这是因为它们不是通过理解而只是根据预设来行动。”这一点，到现在还没有发生本质的改变。

目前人工智能还是和人的智能有巨大差距，还没有达到类人智能。如何实现类人智能呢？我认为它的切入点就在脑科学加上人工智能。

为什么这么说？我给大家举个简单的例子，线虫是一个非常简单的生物，只有302个神经元，麻省理工学院的研究者模仿了其中的19个神经元，就完成了自动驾驶这个任务，其参数比传统的大模型要足足低三个数量级，只有75000个参数，而且对不同道路的适应，具有非常高的通用性和可解释性，以及非常强的鲁棒性，白天、晚上都可以完成自动驾驶。仅仅模仿来自于简单生物线虫的19个神经元，就可以完成自动驾驶里一般的任务，这是因为生物不是靠数量来取胜，而是靠32亿年进化形成的智慧取胜，这项研究模仿的是32亿年进化形成的智慧。从这个角度来讲，人类的大脑是目前这个世界上最聪明的大脑，有860亿个神经元，平均每个神经元有3000个连接，它仍然代表着这个宇宙中在智力上最高的成就，那人工智能的发展为什么不能向人脑学习，以人脑为模板，以人脑为借鉴，来发展出更好的人工智能呢？

我的同事黄铁军、马雷老师，他们模拟了线虫的302个神经元，构建了一个数字线虫，来模仿线虫在水里的游动。这些数字线虫能够组成群体，能够感知环境，能够找到食物的所在，能够协同一块游到有食物的地方进食，就跟真的线虫一样。

，时长00:23

只有302个神经元的模仿，只是一个开始，下一步也许我们要去模仿神经元数量百万级的果蝇，到更高量级的斑马鱼，甚至到小鼠、大鼠、到猕猴，最后到达人类的860亿个神经元。当然仅仅从神经元的数量上来讲这就差了9个数量级，背后更多的是不同的机制、不同的算法，有很多未知的东西我们还不了解。所以，从线虫到人类的大脑还存在巨大的鸿沟，但是我坚信通过脑科学加上人工智能，有一天也许能够造出一个数字人类大脑。

1903年，莱特兄弟让第一架飞机飞行者一号在海滩上飞行时，在空中只停留了12秒，总共只飞行了约36.6米，虽然现在看起来微不足道，但是在当时这代表了人类第一次摆脱了重力的束缚，开始向天空进行探索。我们今天能坐飞机出行，其实就是从一百年前那一次简单的尝试开始。所以，现在脑科学赋能人工智能，虽然只是一个非常卑微的开始，但是我相信有一天人工智能也会变得跟人类的大脑一样聪明，甚至超越人类大脑。

站在进化节点上，什么是你要做的事？

莎士比亚说：“所谓过往，皆为序章。”我们现在就站在了一个进化的节点上。从32亿年前，一个单细胞逐渐发展成水生动物，然后爬上岸边，变成两栖动物，然后变成哺乳动物，大约在300万年前哺乳动物猿猴又开始进化成人类，这些都意味着我们的过去。我们的现在是过去的未来，已经写定，但是我们此时此刻绝对不是未来的过去，因为我们的未来是未定的，取决于我们现在如何做出选择。

人类发明出了人工智能，在今天随着算力的增加，随着技术的进步，它开始变成了一种超越人类的可能。我们现在需要对具有一切可能的未来做出选择。未来会是什么样子？大约有三种。第一种，人工智能像科幻电影《星球大战》里的R2-D2一样，是人类忠实的伙伴，成为人类非常好的朋友，帮助人类变成更强大的人类。第二种可能，我们构建出一个数字大脑，它的能力可能比现在人类的大脑更强，这时候可以人机合二为一，把我们的意识、记忆、情感上传到这个数字大脑里，如果CPU坏了就换一块CPU，内存需要扩大一点就加点内存，这样人就可以获得“永生”。未来学家库兹韦尔在《奇点来临》这本书中认为大约在2045年，这一刻就会到来。所以库兹韦尔从谷哥首席未来学家这个岗位上辞职了，回到家里，每天吃维生素、养生，就是为了活到2045年。第三种可能，就是《终结者》里所展示的，人类文明消失，进入机器文明。

讲座现场

未来会怎么样，最终取决于我们现在站在这个时间节点上要做什么。所以站在这个时间节点上什么是你要做的事情，这是值得思考的问题。物理学和心理学对什么是值得做的事情有不同定义。物理学更在意空间，人间的一切问题，要是放在一个远远超出地球的空间尺度下来看，它们到底还有没有意义？牛顿力学在地球这个空间尺度没有问题，但是一旦进入宇宙空间或进入更小的量子空间就不再适用。但是对于我们每个有心理世界的人而言，我们所关心的不是空间，而是时间。我们所问的问题是：人间的一切问题，要是放在一个远远超出人的寿命的时间尺度下来看，它们到底还有没有意义？究竟是北京三环里一套120平米的房子更重要，还是去回答一个超越你生命的问题更重要？

我们怎么解决这些问题呢？先贤已经给了我们答案，在1905年时，孙中山和严复在伦敦有一次著名的会面，他们当时讨论半殖民半封建的中国究竟如何改变，严复提出要慢慢教化民众，要稳步向前。孙中山对于严复这种循序渐进的方法不太认同，他说：“俟河之清，人寿几何？君为思想家，鄙人为实行家。”后来，孙中山就回到了国内开启了轰轰烈烈的辛亥革命，推动了中国从半殖民半封建国家向现代国家转变。这种精神，也是我们清华大学一向所强调的行胜于言。所以对于现在的我们，就是要以有限的生命行超越生命之事，因为我们今天站在了这个进化的节点之上。

谢谢各位！

现场提问的观众

本次讲坛通过人民日报客户端、中新网、光明网、央视频、澎湃新闻、咪咕视频、腾讯新闻、搜狐教育、凤凰网、百度新闻、抖音、B站、今日头条、微博、快手、小红书、有道词典等媒体和平台在线同步直播，通过新华网进行录播。

“人文清华”讲坛是清华大学发起的大型思想传播活动，推动建设更创新、更国际、更人文的清华新百年。讲坛定期邀请优秀人文学者，在标志性建筑新清华学堂发表公众演讲，阐述其经典学说、独特思考和重大发现。

首页

部门设置

部门领导

综合办公室

项目办公室

学科办公室

主要职能

文科动态

清华文科

人文清华讲坛

文科沙龙

研究机构

文科期刊

文科建设处

脑与人工智能：站在进化的节点上——人文清华讲坛刘嘉演讲实录