从“深蓝” 到“阿尔法狗”，人工智能发展的一大步

本版

第76版：100年·世界上的这一周

从“深蓝” 到“阿尔法狗”，人工智能发展的一大步
目录

第1页:封面

第3页:新民一周

第6页:特稿

第8页:特稿

第9页:特稿

第10页:特稿

第11页:特稿

第12页:特稿

第13页:特稿

第14页:特稿

第15页:特稿

第16页:特稿

第17页:特稿

第18页:特稿

第19页:特稿

第20页:特稿

第21页:特稿

第22页:特稿

第23页:特稿

第24页:特稿

第25页:特稿

第26页:特稿

第27页:特稿

第28页:特稿

第29页:特稿

第30页:特稿

第31页:特稿

第32页:特稿

第33页:特稿

第34页:特稿

第35页:特稿

第36页:特稿

第37页:特稿

第38页:特稿

第39页:特稿

第40页:特稿

第41页:特稿

第42页:特稿

第43页:特稿

第44页:特稿

第45页:特稿

第46页:特稿

第47页:特稿

第48页:特稿

第49页:特稿

第50页:特稿

第51页:特稿

第52页:特稿

第53页:特稿

第54页:特稿

第55页:特稿

第56页:特稿

第57页:特稿

第58页:特稿

第59页:特稿

第60页:特稿

第61页:特稿

第62页:特稿

第63页:特稿

第64页:特稿

第65页:特稿

第66页:广域/读家

第67页:广域/读家

第68页:广域/七日谈

第69页:广域/观察家

第70页:广域/漫漫谈

第71页:广域/漫漫谈

第72页:广域/城与事

第74页:广域/城与事

第76页:100年·世界上的这一周

第77页:100年·世界上的这一周

第78页:社会

第79页:社会

第80页:社会

第81页:社会

第82页:财富

第83页:财富

第84页:财富

第85页:虚构

第86页:虚构

第87页:虚构

第88页:虚构

第89页:虚构

第90页:专栏/人间声色

第91页:汽车

第92页:专栏/九层塔

第93页:专栏/花花世界

第94页:艺术

第95页:读书

第96页:影视

第76版：100年·世界上的这一周 2020-05-18

从“深蓝” 到“阿尔法狗”，人工智能发展的一大步

周洁

超越人类的思维限制，创造出一种能够自我学习、自我进步的超级大脑，一直是人类的终极梦想。

记者｜周　洁

对于人工智能来说，1997 年5 月11 日是历史性的一天。IBM 的超级计算机“深蓝”（Deep Blue）以2 胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里·卡斯帕罗夫，一时间全球轰动。

“深蓝” 的设计者们在当时就想到了下一个小目标：“何时计算机也能下围棋呢？”

2016 年3 月15 日，谷歌围棋人工智能“阿尔法狗”（Alpha Go）与韩国棋手李世石对弈并以4：1 的成绩获胜，这场“人机大战” 成为人工智能史上一座新的里程碑，也再次为人工智能技术做了科普——

从“深蓝” 到“阿尔法狗”，这二十多年的发展似乎也在预示着，人工智能终将改变人类的生活。

计算机的胜利

超越人类的思维限制，创造出一种能够自我学习、自我进步的超级大脑，一直是人类的终极梦想。

IBM 的“深蓝” 最早可以追溯到1985 年，当时卡内基梅隆大学的博士生许峰雄开始开发一种名为“芯片测试” 的国际象棋电脑“深思”(Deep Thought)（来源于科幻小说《银河系漫游指南》中的一台机器）。后来，许峰雄和他的同事被IBM 聘用，继续从事国际象棋的研究工作。

卡斯帕罗夫是国际象棋史上最伟大的棋手之一，他不仅精通国际象棋，还是一位数学家、计算机专家，并且精通15 国语言。他的棋风活泼，有异常敏锐的感知判断力，对弈时常常能以出人意料的策略赢得比赛。

卡斯帕罗夫曾在1989 年的两场比赛中轻松击败“深思”，于是IBM 团队继续改进他们的超级计算机，1993 年将其重新命名为“深蓝”，这是Deep Thought 和IBM 蓝色LOGO 的组合。

1996 年2 月17 日，卡斯帕罗夫对阵IBM“深蓝” 计算机，最终，卡斯帕罗夫以4:2 战胜“深蓝”，一举夺得40 万美元奖金。

这场比赛给许峰雄团队带来了信心，因为出乎他们的意料，世界象棋冠军在第一场比赛中输给了“深蓝”。比赛结束后，许峰雄团队一直在为“深蓝” 做升级，升级后，“深蓝” 每秒可以检测2 亿个不同的国际象棋位置。

1997 年5 月3 日，又一场人机大战开始了。卡斯帕罗夫赢了第一场，深蓝赢了第二场。第三、第四和第五局以平局告终。5 月11 日，深蓝以3.5 比2.5 的比分赢得了第六场比赛。

对于这场胜利，“深蓝” 设计者许峰雄认为，这主要是依靠“深蓝” 强大的计算能力穷举所有路数来选择最佳策略：“深蓝” 靠硬算可以预判12 步，卡斯帕罗夫可以预判10 步。

如今“深蓝” 的性能已经不再值得一提，就CPU 来说，早在2006 年，英特尔推出的第一代酷睿2 就已经超过了“深蓝”，我们国家超级计算机天河二号的浮点运算能力，则是“深蓝”的30 万倍。

但计算机战胜人类的开端，则为人工智能的从业者带来了更大的想象空间。

从“算” 到“学”，人工智能发展的一大步

从今人的角度来看，“深蓝” 还算不上足够智能，它的算法核心是暴力搜索：生成尽可能多的走法，执行尽可能深的搜索，换言之，它每走一步，几乎都是在遍历后续所有可能的情况下作出的决策。

因此，很多人认为这是计算机的胜利，而不是人工智能的胜利。

但2016 年一战成名的Alpha Go 不同。围棋和国际象棋在复杂程度上不可同日而语，围棋变数极多，一回合有250种可能，而一盘棋可以长达150 回合。显然“深蓝” 式的硬算在围棋上行不通。

Alpha Go 胜利的秘诀不仅仅是计算机强大的计算能力，更依赖其精妙的算法。Alpha Go 的算法的核心则依靠强化学习、深度学习和蒙特卡洛树搜索。“强化学习让Alpha Go 有了自学能力，深度学习让Alpha Go 通过数据驱动的机器学习有了估值量化能力，蒙特卡洛树则是一个连接所有技术和动作的框架。”

“感觉就像一个有血有肉的人在下棋一样，该弃的地方也会弃，该退出的地方也会退出，非常均衡的一个棋风，真是看不出出自程序之手。” 柯洁曾这样评价Alpha Go。

2017 年，Alpha Go 进一步升级为新版程序 Alpha Go Zero：从空白状态学起，在不利用人类任何围棋比赛数据作为训练数据的条件下，它能够迅速通过2900 万次自我博弈、自学围棋，并以 89 比11 的战绩击败“前辈”。

有专家形容Alpha Go Zero 在某种程度上部分突破了人类认知学习的能力，原理上可以习得包括围棋在内的其他观测信息是完备的、状态动作空间是可数的各种人类技艺，甚至展现出“直觉” 判断能力。

人工智能的应用当然不会只是用来下棋，智能搜索、无人驾驶汽车、智能机器人……人工智能已经在试探着进入人类实际生活之中，许多人说，未来人类的大部分工作或许都将被人工智能取代。

对于这一点，卡斯帕罗夫或许有更深的感受。

作为第一个工作受到机器威胁的知识工作者，23 年后2020年，卡斯帕罗夫再次回到了被“深蓝” 打败的纽约一个酒店的宴会厅参加活动，他说自己已经与人工智能和平相处。

“这场比赛不是诅咒，而是福气，因为我成为了一件非常重要事情的一部分。 22 年前，我的想法可能不同。” 卡斯帕罗夫表示，每种技术都会在创造就业机会之前就破坏就业机会。也许在未来，人类角色将会是牧羊人。人类只需轻轻推动智能算法，将正确的机器放在正确的空间中执行正确的任务，那么剩下的事就可以交给机器来完成。

而当下，几乎所有人都认为，目前人工智能发展水平还处在初级阶段。“目前人工智能算法大多依赖高质量的海量数据，需要的功率也远高于人类大脑的能耗水平，同时也很难应用于多种场景。一个明显的例子就是，Alpha Go 的实现方法在明确定义的环境下效果明显，而在开放环境下，结果往往不尽如人意。”

但从“深蓝”到“阿尔法狗”，人工智能已经走上了正确方向，一切才刚刚开始。

历史上的这一周

1951年5月12日，第一颗氢弹爆炸试验成功。

1968年5月13日，法国五月风暴兴起。

1948年5月14日，以色列正式宣布独立。

1991年5月15日，法国第一位女总理克勒松夫人就任。

1929年5月16日，第一届电影“学院奖”（后来的奥斯卡）在好莱坞颁奖。

1973年5月17日，美参议院专门小组开始水门事件听证会。