2020年11月30日,DeepMind公司的另一个人工智能程序AlphaFold 2在蛋白质构造预测大赛CASP 14中,对大部分蛋白质构造的预测与真实构造只差一个原子的宽度,达到了人类利用冷冻电子显微镜等繁芜仪器不雅观察预测的水平,这是蛋白质构造预测亘古未有的巨大进步。这一重大成果虽然没有引起媒体和广大民众的关注,但生物领域的科学家反应强烈。
中国科学院院士施一公对媒体说:“依我之见,这是人工智能(AI)对科学领域最大的一次贡献,也是人类在21世纪取得的最主要的科学打破之一,是人类在认识自然界的科学探索征程中一个非常了不起的历史性造诣。”
蛋白质是生命的根本,理解蛋白质的折叠构造和分子动力学是生物学界最棘手的问题之一,已经困扰科学家50年之久。
目前已知氨基酸顺序的蛋白质分子有1.8亿个,但三维构造信息被彻底看清的还不到0.1%。最近DeepMind公司在《自然》上宣告已将人类的98.5%的蛋白质预测了一遍,操持今年年底将预测数量增加到1.3亿个,达到人类已知蛋白质总数的一半,并且公开了AlphaFold 2的源代码,免费开源有关数据集,供全天下科研职员利用。
被开释的海量蛋白质构造信息蕴含着生命信息的密码,将有力推动生命科学的发展,大大加速针对癌症、病毒的抗生素、靶向药和新效率的蛋白酶的研发。
在AlphaFold 2 问世以前,许多科学家做过用打算机预测蛋白质三维折叠构造的研究。中科院打算技能研究所的卜东波团队去年在《自然》揭橥论文,他们在蛋白质构造预测方面做出了出色的成果。
DeepMind团队采取的把稳力机制也是打算机视觉和自然措辞处理领域较成熟的技能。最近华盛顿大学推出预测准确度与AlphaFold 2差不多的新算法,只须要一个GPU,10分钟旁边就能算出蛋白质构造。
蛋白质折叠问题的办理是生物学界和人工智能界长期互助努力的结果,但AlphaFold 2的“临门一脚”是取得胜利的标志性打破,它用精确的预测结果显示出人工智能技能在根本科学研究上的巨大威力。AlphaFold 2的巨大成功给我们许多耐人寻味的启迪。
2017年国务院印发《新一代人工智能发展方案》后,我国立即启动了“新一代人工智能重大科技项目”,开展数据智能、跨媒体感知、群体智能、类脑智能、量子智能打算等根本理论研究,统筹布局了人工智能创新平台和许多关键共性技能研究。
近三年,我国学者揭橥了大量人工智能论文,申请几万件专利,在北京冬奥会、城市大脑等运用处景和抗击新冠疫情中取得显著成效,涌现了一些人工智能独角兽企业,取得的成绩可圈可点。但总的来讲,我们的研究多数是技能驱动、论文导向的,目标导向和问题导向的研究较少。
AlphaFold 2的成功首先是由于10年前DeepMind团队就开始关注“蛋白质折叠”这个有重大代价的科学问题。几年前用打算机预测繁芜的蛋白质折叠构造,精确率还不到40%,DeepMind团队当时就有信心占领这个天下难题。
我们与一流科学家的差距之一是选择可打破的重大科学问题的眼力不足敏锐,布局的科研项目要么是增量式的技能改进,要么是几十年都难以打破的空想型目标,像蛋白质折叠这样的主要研究方向没有列入新一代人工智能重大科技项目。
人工智能研究可能取得重大打破的目标不但是蛋白质折叠,我认为,用机器学习的方法全自动地做集成电路的前端和后端设计也有可能在十年旁边取得打破,如果做到了,让人焦心的集成电路设计职员缺口巨大的难题就会迎刃而解。这一类涉及经济发展的重大问题该当是人工智能界关注的焦点。
为什么重大科学问题和国计民生问题没有进入人工智能界许多学者的视野,这涉及对人工智能这门学科的认识。
最先提出“人工智能”这个术语的麦卡锡对这门学科的定义是:“人工智能便是要让机器的行为看起来就像是人所表现出的智能行为一样。”后来的人工智能学者大多盯住了“像人”这个“原则”,以“像不像人”作为目标。所谓衡量智能水平的“图灵测试”也是遵照这个原则。付与沙特阿拉伯公民身份的“索菲娅”和清华大学的“华智冰”机器人,都是朝着“像人”这个目标努力。
但硅基的打算机和碳基的人脑究竟有实质性的差异,非要把电子线路构成的机器做成与人一样,既没有必要也没有可能。
现在用于机器学习的人工神经网络与人的大脑有相似的地方,但也表示出与人的思维不同的机器“思维”办法。理性的人工智能发展模式该当承认人有人智、机有机“智”,要充分发挥机器“思维”的特长,做人不善于做的事情。
AlphaFold 在蛋白质构造预测上表示出的才能不是“像人”,而是比人高明。人工智能是对人类的补充和增强,而非替代人类,我们并不须要复制人的智能,而是要建立一个新的智能系统。人工智能研究摆脱“模拟人”“替代人”的思想束缚后,会有更广阔的发展空间。
AlphaFold的成功表明,疑难问题的办理不一定完备依赖于人类的先验知识,这意味着在人工智能时期,人类获取知识的逻辑将发生根本性变革,对人类认知将产生巨大冲击。
机器学习是一种全新的、人类也无法真正理解、但能被实践考验的认知方法论。我们是相信“实践是考验真理的标准”,人机互补构建命运共同体,还是坚持机器必须给人讲明白演绎和归纳过程才是真理,人类将面临新的选择。
机器学习可以精确预测蛋白质构造,解释机器已节制了一些人类还不明白的“暗知识”。过去我们把可以表达的知识叫作“明知识”或“显知识”,不可表达但可以感想熏染的知识叫作“潜知识”或“默知识”。现在又多出了一类既不可表达又不可感想熏染但机器能明白的知识,可称为“暗知识”。知识维度的增加大大扩充了人类的视野。如果说“明知识”是冰山显露出来的一角,“潜知识”是冰山海面下的部分,“暗知识”就犹如大海。对人类而言,如何利用“暗知识”可能比弄明白“暗物质”“暗能量”更主要、更紧迫。
蛋白质构造预测取得重大打破的另一个启迪是,科研范式已经开始转向。
AlphaFold团队是一个范例的跨学科互助团队,在《自然》揭橥此重大成果的论文作者有34位,个中19位并列第一作者,包括机器学习、语音和打算机视觉、自然措辞处理、分子动力学、生命科学、高能物理、量子化学等领域的有名学者。蛋白质形成稳定折叠构造的缘故原由是分子内部的势能会降到最低点,预测打算实际上是能量最小化的优化。
深度学习的人工神经网络在打算机视觉、自然措辞处理和生物信息学等领域表现精良,不仅仅源于算法和数学,背后还有深层次的物理事理。因此,理论物理学家的参与十分主要。基于最根本科学事理的机器学习须要人类多领域科学家的聪慧和机器“智能”有机领悟,不同于以创造干系性为紧张目标的科研第四范式——数据密集型科学创造,我认为这是科研第五范式的雏形。
AlphaFold并没有提出新的科学事理,而是研究已知事理的相互组合呈现出的大量新奇构造、特性和行为,把对构造的认知抽象成各种模式的自动化识别和匹配,实质上是一种集成式的工程科学技能。
过去生物学家只是把人工智能当成浩瀚的赞助工具之一,AlphaFold的成功改变了生物学家的意见。工程科学技能不但是工具,也不仅仅是根本研究成果的运用,而是在根本研究中可以发挥巨大浸染的主要组成部分。没有像DeepMind团队一样强大的工程技能实现能力,根本研究也难以做出重大成果。
目前我国大学和企业的人工智能实验室大多碰着顶天顶不了、立地又落不下去的困境,希望人工智能界的学者负责总结履历教训,在研究方向选择上多费点心思,争取得到让人眼睛一亮的重大成果。
(李国精品者系中国工程院院士)
来源: 中国科学报