2024年03月19日 星期二
从“深蓝” 到“阿尔法狗”,人工智能发展的一大步
第76版:100年·世界上的这一周 2020-05-18

从“深蓝” 到“阿尔法狗”,人工智能发展的一大步

周洁

超越人类的思维限制,创造出一种能够自我学习、自我进步的超级大脑,一直是人类的终极梦想。

记者|周 洁

对于人工智能来说,1997 年5 月11 日是历史性的一天。IBM 的超级计算机“深蓝”(Deep Blue)以2 胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里·卡斯帕罗夫,一时间全球轰动。

“深蓝” 的设计者们在当时就想到了下一个小目标:“何时计算机也能下围棋呢?”

2016 年3 月15 日,谷歌围棋人工智能“阿尔法狗”(Alpha Go)与韩国棋手李世石对弈并以4:1 的成绩获胜,这场“人机大战” 成为人工智能史上一座新的里程碑,也再次为人工智能技术做了科普——

从“深蓝” 到“阿尔法狗”,这二十多年的发展似乎也在预示着,人工智能终将改变人类的生活。

计算机的胜利

超越人类的思维限制,创造出一种能够自我学习、自我进步的超级大脑,一直是人类的终极梦想。

IBM 的“深蓝” 最早可以追溯到1985 年,当时卡内基梅隆大学的博士生许峰雄开始开发一种名为“芯片测试” 的国际象棋电脑“深思”(Deep Thought)(来源于科幻小说《银河系漫游指南》中的一台机器)。后来,许峰雄和他的同事被IBM 聘用,继续从事国际象棋的研究工作。

卡斯帕罗夫是国际象棋史上最伟大的棋手之一,他不仅精通国际象棋,还是一位数学家、计算机专家,并且精通15 国语言。他的棋风活泼,有异常敏锐的感知判断力,对弈时常常能以出人意料的策略赢得比赛。

卡斯帕罗夫曾在1989 年的两场比赛中轻松击败“深思”,于是IBM 团队继续改进他们的超级计算机,1993 年将其重新命名为“深蓝”,这是Deep Thought 和IBM 蓝色LOGO 的组合。

1996 年2 月17 日,卡斯帕罗夫对阵IBM“深蓝” 计算机,最终,卡斯帕罗夫以4:2 战胜“深蓝”,一举夺得40 万美元奖金。

这场比赛给许峰雄团队带来了信心,因为出乎他们的意料,世界象棋冠军在第一场比赛中输给了“深蓝”。比赛结束后,许峰雄团队一直在为“深蓝” 做升级,升级后,“深蓝” 每秒可以检测2 亿个不同的国际象棋位置。

1997 年5 月3 日,又一场人机大战开始了。卡斯帕罗夫赢了第一场,深蓝赢了第二场。第三、第四和第五局以平局告终。5 月11 日,深蓝以3.5 比2.5 的比分赢得了第六场比赛。

对于这场胜利,“深蓝” 设计者许峰雄认为,这主要是依靠“深蓝” 强大的计算能力穷举所有路数来选择最佳策略:“深蓝” 靠硬算可以预判12 步,卡斯帕罗夫可以预判10 步。

如今“深蓝” 的性能已经不再值得一提,就CPU 来说,早在2006 年,英特尔推出的第一代酷睿2 就已经超过了“深蓝”,我们国家超级计算机天河二号的浮点运算能力,则是“深蓝”的30 万倍。

但计算机战胜人类的开端,则为人工智能的从业者带来了更大的想象空间。

从“算” 到“学”,人工智能发展的一大步

从今人的角度来看,“深蓝” 还算不上足够智能,它的算法核心是暴力搜索:生成尽可能多的走法,执行尽可能深的搜索,换言之,它每走一步,几乎都是在遍历后续所有可能的情况下作出的决策。

因此,很多人认为这是计算机的胜利,而不是人工智能的胜利。

但2016 年一战成名的Alpha Go 不同。围棋和国际象棋在复杂程度上不可同日而语,围棋变数极多,一回合有250种可能,而一盘棋可以长达150 回合。显然“深蓝” 式的硬算在围棋上行不通。

Alpha Go 胜利的秘诀不仅仅是计算机强大的计算能力,更依赖其精妙的算法。Alpha Go 的算法的核心则依靠强化学习、深度学习和蒙特卡洛树搜索。“强化学习让Alpha Go 有了自学能力,深度学习让Alpha Go 通过数据驱动的机器学习有了估值量化能力,蒙特卡洛树则是一个连接所有技术和动作的框架。”

“感觉就像一个有血有肉的人在下棋一样,该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出出自程序之手。” 柯洁曾这样评价Alpha Go。

2017 年,Alpha Go 进一步升级为新版程序 Alpha Go Zero:从空白状态学起,在不利用人类任何围棋比赛数据作为训练数据的条件下,它能够迅速通过2900 万次自我博弈、自学围棋,并以 89 比11 的战绩击败“前辈”。

有专家形容Alpha Go Zero 在某种程度上部分突破了人类认知学习的能力,原理上可以习得包括围棋在内的其他观测信息是完备的、状态动作空间是可数的各种人类技艺,甚至展现出“直觉” 判断能力。

人工智能的应用当然不会只是用来下棋,智能搜索、无人驾驶汽车、智能机器人……人工智能已经在试探着进入人类实际生活之中,许多人说,未来人类的大部分工作或许都将被人工智能取代。

对于这一点,卡斯帕罗夫或许有更深的感受。

作为第一个工作受到机器威胁的知识工作者,23 年后2020年,卡斯帕罗夫再次回到了被“深蓝” 打败的纽约一个酒店的宴会厅参加活动,他说自己已经与人工智能和平相处。

“这场比赛不是诅咒,而是福气,因为我成为了一件非常重要事情的一部分。 22 年前,我的想法可能不同。” 卡斯帕罗夫表示,每种技术都会在创造就业机会之前就破坏就业机会。也许在未来,人类角色将会是牧羊人。人类只需轻轻推动智能算法,将正确的机器放在正确的空间中执行正确的任务,那么剩下的事就可以交给机器来完成。

而当下,几乎所有人都认为,目前人工智能发展水平还处在初级阶段。“目前人工智能算法大多依赖高质量的海量数据,需要的功率也远高于人类大脑的能耗水平,同时也很难应用于多种场景。一个明显的例子就是,Alpha Go 的实现方法在明确定义的环境下效果明显,而在开放环境下,结果往往不尽如人意。”

但从“深蓝”到“阿尔法狗”,人工智能已经走上了正确方向,一切才刚刚开始。

历史上的这一周

1951年5月12日,第一颗氢弹爆炸试验成功。

1968年5月13日,法国五月风暴兴起。

1948年5月14日,以色列正式宣布独立。

1991年5月15日,法国第一位女总理克勒松夫人就任。

1929年5月16日,第一届电影“学院奖”(后来的奥斯卡)在好莱坞颁奖。

1973年5月17日,美参议院专门小组开始水门事件听证会。

读报纸首页