2024年05月07日 星期二
计算生物学从边缘到龙头
第48版:浦江科学大师讲坛 2022-11-28
诺贝尔化学奖得主迈克尔·莱维特精彩讲述

计算生物学从边缘到龙头

陈冰

上图:迈克尔·莱维特作为浦江科学大师讲坛的首位演讲嘉宾,金句迭出。

扫码观看独家访谈视频

上图:演讲现场吸引了许多观众。

“基础科学研究就像买彩票,你无法预测结果,但你可以多买几张‘彩票’,这更有助于得到一流的发现。”在莱维特看来,基础科学研究就像蚂蚁寻找隐藏起来的食物一样,存在许多不确定性,因此遇到困难与失败在所难免。“如果没有失败,恰恰可能意味着你的研究并没有太大难度。”

记者|陈冰

“地球上最具智慧的是什么?是电脑吗?是某个人吗?是诺贝尔奖得主吗?”

“如果没有失败,恰恰可能意味着你的研究并没有太大难度。”

“生物进化中不是最适者生存,而是最具多样性者生存,多样性使人们变得聪明。”

“基础科学研究就像买‘彩票’,你无法预测结果,但你可以多买几张‘彩票’,这更有助于获得一流的发现。”

11月15日,2013年诺贝尔化学奖得主、复旦大学复杂体系多尺度研究院荣誉院长迈克尔·莱维特(Michael Levitt),作为浦江科学大师讲坛的首位演讲嘉宾,金句迭出。

他用幽默风趣的语言讲述了计算生物学如何从一个现代生命科学中的“边缘”学科一跃成为引领性的龙头学科的过程,讨论了“无用”的基础科学和“有用”的应用科学之间的深层依存关系,启发人们重新思考和认识这二者的有机结合方式,在从事科学研究时该如何选择深入钻研的方向。

地球上什么最聪明?

从数学、计算机科学,到物理、化学,再到生物、医学,世界顶尖科学家迈克尔·莱维特的研究涉及多个学科领域。他首创了蛋白质和DNA的分子动力学模拟方法,并一直致力于蛋白质结构预测技术的关键评估,研究蛋白质结构的折叠和包装,开发用于大规模序列结构比较的评分系统。

“地球上最具智慧的是什么?是计算机吗?是人吗?是聪明的人吗,还是诺贝尔奖获得者?其实都不是,最聪明的其实是生物。因为生物(biology)创造了我们人类,生物界可以折叠蛋白质,生物界可以做任何事。”在他看来,没有哪位化学家能制作出令人难以置信的接近生物的化学分子,也没有任何一个材料科学家能制作出皮肤或者大脑。生物学与人类智能及人工智能关系紧密。

我们的生命离不开蛋白质。蛋白质是一切生命活动的基础物质,它是运输氧气的载体,是帮助抵御病毒的抗体,也是消化食物的酶。蛋白质之所以能够承担多种多样的功能,很大程度上是因为它们具有丰富而复杂的空间结构。可是,蛋白质如何折叠成这些独特的形状呢?

几十年来,科学家们一直在努力解决生物学最大的挑战之一——预测由氨基酸组合折叠而成的蛋白质的三维结构。莱维特说,蛋白质折叠分子其中每个原子都有精确的定位,可能直径连一纳米的1/10都不到。蛋白质的折叠可以说是生命得以产生、得以延续一个非常重要的奥秘。

每一个生命体的功能或组织中,都是由各种类型的蛋白质进行折叠以后的结果。蛋白质进行折叠以后,自动形成了各种各样的形状,就像搭房子一样,可以把所有的形状放在一起,自动就形成了一套房子的样子。“如同拼图一样拼接起来,就形成了生命体的千姿百态、多种多样。所以,自然是非常聪明的一个‘建筑师’,我们可以从自然学到很多的经验。人工智能发展的背后就有生物学。1943年一位神经生物学家的模型推动了人工智能的发展。感知器,就是一个单层的人神经网络,机器学习中用的神经网络其实就是在模仿生物的学习过程。这样一种结构,对学习而言是效率比较高的。”

在莱维特看来,细菌的后代就是细菌自身的一个拷贝或复制。所以如果这个细菌非常适合(生存),它的后代跟它的基因是完全一样的。所以,“适者生存”对细菌来说,似乎是说得过去的。现在的细菌跟30亿年前的细菌没有什么不一样,但自然界需要发明新的东西。因此,来自父母的细胞结合到一起,然后后代有一个随机混合的基因。其中不一定把父亲最好的基因和母亲最好的基因结合到子代中,只是随机把父亲和母亲的基因结合到一起,生成了后代。

“为什么自然做出这样的选择?可能自然认识到,未来是未知的,为了未来的生存权,需要多样性,需要各种不同的行为模式,才能生存下来。如果要建立一个伟大的生命或伟大的社会,我们需要多样性,这样才能生存。这就是为什么人类发展出了智商,智商是多元化的一个东西,我们可以用智力做各种事情、创造各种文明。所以,在某种程度上,多样性带来了智慧。”

无用or有用

究竟什么是科学?在拉丁语中,“科学”意味着知识、专业或是经验。“新的知识,是做事的一种新配方。这是我所喜欢的关于科学的定义。”莱维特说,他经常思考什么是知识,有一天,他忽然意识到,其实知识就是文明的DNA。

“DNA就像一本书,它描述了创造一个人的‘配方’,而各种各样的知识就相当于文明的DNA,告诉我们如何建造礼堂、制造摄像机等等。我们把信息融入到了DNA当中,DNA可以得到复制,因此信息也可以得到复制。我们慢慢地从DNA逐步演化到了固态硬盘这样的东西,然而世界上DNA的数量比我们现在计算机里存储的所有的信息总量都多,可以达到1E25个TB,而且每个细胞都有自己的DNA。”

我们应该如何用系统的方式来思考科学的问题?也许核心要义就是要允许犯错。“当你做一件非常困难的事情,非常重要的一点就是出错。有人会说我从来没错过,这意味着你可能从来没做过任何困难的事情。看看孩子是怎么学会走路的,他会不断摔跤。如果你要解决一个非常困难的科学问题的话,必须要做好准备,要接受自己可能会错误。我认为我们需要某种教育,要让人们出错。比如考试由随机分数来评分。犯错误是很正常的事情,你错得越多,证明你做了更多困难的工作。”

他认为,理论研究是用一种简单易懂的模型来解释观测现象,而实验则是尝试获得额外的观测来证明或否定模型,两者需要不同的高级技能,也需要彼此之间的沟通交流。无论从理论还是实验科学而言,我们都不可能让单一的科学解决所有的问题。

也正因为此,莱维特呼吁促进跨学科研究,打破学科的壁垒,“跨学科的研究极其重要,因为它体现出的是多样性、多元性的一种美感。在这种多元化的环境中工作,就像父本和母本缔造了子本,那子一代就会展现出比父本和母本更加优秀的一种特征,这对产生前沿科技成果是非常重要的”。

基础科学重要吗?“如果没有对科学领域的深入了解,很难评估基础科学的价值。比如,载人登月的任务目标非常明确,但基础科学研究很难有具体目标。”莱维特认为,所谓基础科学就是还没有被应用的科学,一开始有一些科学发现之后,我们会觉得它毫无用处,但是实际上任何的科学知识都是有用的。一些非常基本的数学问题,可能成为我们现代所使用的非常复杂的密码系统的基础,当时这些数学理论被发现的时候没有人想到它有什么用处,但实际上它的价值极其巨大。

“基础科学研究就像买彩票,你无法预测结果,但你可以多买几张‘彩票’,这更有助于得到一流的发现。”在莱维特看来,基础科学研究就像蚂蚁寻找隐藏起来的食物一样,存在许多不确定性,因此遇到困难与失败在所难免。“如果没有失败,恰恰可能意味着你的研究并没有太大难度。”

诺奖“五要素”

“我曾经工作过的剑桥医学研究委员会分子生物学实验室,是一个不大的研究所,但却出了28位诺奖得主。”莱维特在演讲中说到。

如何才能获得诺奖?在他看来,需要具备“五要素”,即具有充足的研究经费,如每个团队每年160万美元;不存在明显的官僚主义;以小型团队(5人左右)为宜;来自同侪的强大压力,“只有你的下一篇论文优秀,你才算优秀”;没有等级观念,学生们和诺奖得主一样充满自信。

“事实上,很多诺奖成果都是科学家最富创造力的青年时期完成的,但科学界对年轻人却存在着偏见。”莱维特说,1980年时,美国把3%的科研经费给了60岁以上的课题组长。到了2014年,3%的科研经费给了70岁以上的课题组长。当50至70岁的课题组长获得科研资金的比例增加时,研究部门会让他们继续留任。而40岁以下的课题组长获得科研资金的比例减少时,研究部门将雇用更少的青年课题组长。

“我们鼓励实验室的年轻科学家相互合作,而非围绕特定个体,即某个资深科学家的想法来工作。我们希望他们做更多创新性的工作。”莱维特说,在他的团队工作的科研人员,也可以去其他团队工作。

28岁时,莱维特就和同事撰写了如何计算蛋白质折叠的论文,这在当时是非常前瞻的研究。而今75岁,如何继续在研究中保持前瞻性?莱维特说,直到现在,他依然对很多问题感到好奇,这让他不断地有动力去尝试新事物。“就像在大海中夜游一样,在科学中怡然自得。”

危机科学

游走于世界各国,莱维特觉得自己更像一个世界公民,仅凭借一部手机,就可以产生与世界的紧密连接。“有人用中文给我写信,有人用希伯来语给我写信,我能够阅读中文报纸杂志,因为我有自动翻译机,可以对语言进行转换,从而在很大程度上克服语言的障碍。”

面向未来,莱维特建议可以打造一个真正的全球虚拟全球实验室。在这个实验室当中,来自于全球各国的顶尖科学家共同合作,他们在不同的地点作出不同的研究,通过远程交互、虚拟现实等技术提升相互之间沟通的效率、效果。“你可以一秒钟之内进入我的实验室,我也可以加入你的实验室。我们的确会在短短的几秒钟之内就完成了很多信息和理念的互通和交流。”莱维特说,虚拟全球实验室作为一个全新概念,将结合真实和虚拟互动,使全球影响力最大化,利用计算生物学和人工智能辅助的“健康技术”改善人类健康。

新冠疫情的大流行让莱维特意识到,在危机中可以产生新的科学研究方向。“危机科学”将会是科学面向未来的一个学科。对新冠疫情的预测、对气候变化的预测,都是危机科学的重要研究内容。比如我们可以通过AI模拟出斯坦福大学胡佛塔被大火吞没的照片,可以模拟出英国剑桥大学被洪水湮没了、特拉维夫市中心被沙尘暴所湮没、上海天际线被洪水台风所湮没产生的严重后果……这些预警将有助于人类从危机中学到科学。

而在AI的加持之下,所有的预测将变得越来越精准。“蛋白质折叠”这一困扰科学家们近50年的难题,在2021年基本得到了破解。英国DeepMind公司研究人员创建的人工智能系统AlphaFold将蛋白质结构预测的准确度提高到了原子水平,这比许多科学家的预期要早了几十年,显示出AI对解决重大科学问题的潜力。

仅仅过了一年时间,DeepMind就进一步破解了几乎所有已知的蛋白质结构,其AlphaFold算法构建的数据库中如今包含了超过2亿种已知蛋白质结构,让人们在查找蛋白质的3D结构时几乎就像在谷歌搜索关键字一样容易。而此前,科学家们只破译了科学界已知的2亿种蛋白质中的一小部分。

在莱维特看来,人工智能最有趣的应用不是蛋白质折叠,而是风险预测。“也许十年以后,我们可以跟手机说话,能不能告诉我,我是不是应该因为这件事情而感到恐慌?在那种情况下,人类会变得更理性,会成为真正的智人,而不是愚人。”

浦江科学大师讲坛

以“根植上海、聚焦前沿,传播科学思想,助力具有全球影响力的科技创新中心建设”为主题,邀请全球顶尖科学家作前沿研究学术报告,力争以最高的学术水准、最新的前沿信息、最具传播力的大师思想,形成最受关注的科学讲坛。

讲坛以复旦大学相辉堂为永久会址,原则上一年举办6期,每期邀请一名顶尖科学家作主报告。讲坛以线下报告与面向全球线上直播相结合的方式进行。

在报告人遴选方面,“浦江科学大师讲坛”组委会下设讲坛学术委员会,由中国科学院院士、复旦大学校长金力担任学术委员会主任,迈克尔·莱维特(Michael Levitt)等十多名顶尖科学家担任成员。讲坛学术委员会将从诺贝尔奖、图灵奖等具有全球影响力奖项的获奖者中,遴选出100名科学家,形成动态大师库,并由讲坛组委会从大师库中遴选确定每期讲坛的具体报告人选。

蛋白质折叠

蛋白质是一切生命活动的基础物质,它是运输氧气的载体,是帮助抵御病毒的抗体,也是消化食物的酶。蛋白质之所以能够承担多种多样的功能,很大程度上是因为它们具有丰富而复杂的空间结构。

每一个生命体的功能或组织中,都是由各种类型的蛋白质进行折叠以后的结果。蛋白质进行折叠以后,自动形成了各种各样的形状。如同拼图一样拼接起来,就形成了生命体的千姿百态、多种多样。蛋白质的折叠可以说是生命得以产生、得以延续一个非常重要的奥秘。

读报纸首页