2025年04月05日 星期六
博弈 人机大战 2.0
第8版:特稿 2022-11-02

博弈 人机大战 2.0

谢靖

“元萝卜” 本报记者 李铭珅 摄

本报记者 郜阳

谢靖不停变化着坐姿。

他一会儿左手抚额,一会儿右手托腮。看得出,他有些吃力。

谢靖是中国第17位获得“棋王”头衔的中国象棋特级大师。他曾在2001年被特级大师胡荣华收为关门弟子,同年获得全国少年赛16岁组冠军,晋升为象棋大师。7年后,又晋升为特级大师。

坐在谢靖对面的,唤作“元萝卜”。“小家伙”的外形不像棋手,倒和宇航员无异,通体白色,戴“黑面罩”,还有一只长长的胳膊,用来磁吸棋子,完成摆棋和对弈。

乘险出车收败卒,隔河飞炮下重城。这一次,在中国象棋的棋盘上,没有硝烟的杀伐,在棋手与人工智能(AI)之间展开。



人机大战来到楚河汉界

有很长一段时间,人工智能这个词变得没那么让人兴奋了。

人们已经躲不开它,但同时也意识到,无论是人工智能的技术演进还是商业应用,似乎都遇到了瓶颈,人们有很多年没再体验到AlphaGo那样的惊艳。

说起AlphaGo,记忆里的某些东西变得模糊又清晰起来。6年前,AlphaGo与李世石九段人机大战。所谓“千古无同局”,这种源自东方的博弈游戏变化达10的172次方,比所知宇宙中的原子数量还要多。

赛前,李世石本人放出狠话,争取以4:1或5:0取胜,而现实却是冰冷残酷,A lphaGo以4:1胜出。更让人们惊叹的是人工智能在打法上表现出原创性,突破了人类棋手的惯用套路!

1997年,超级计算机“深蓝”打败国际象棋冠军加里·卡斯帕罗夫,靠的是人类编程,让机器用“蛮力”穷尽所有可能,并作出选择;但AlphaGo却是被赋予了深度学习算法,经过海量“训练”,自我优化的结果——这一次人机大战,标志着2016年成为人工智能爆发的元年。

一年之后,AlphaGo升级了,对手也换成了中国的柯洁。然而这回,柯洁从一开始就不被看好,若说AlphaGo和李世石的对局或许还备受期待,那么进化的AlphaGo和柯洁的人机大战,不再拥有任何其他的可能。果然,干净利落,柯洁3局全部以失败告终。

时移世异。AlphaGo第一次打败人类时,我们害怕科幻小说中机器人推翻人类、统治人类的“脑洞大开”会有一天真实照进现实,更害怕有一天AlphaGo会因为“照顾”人类的情绪而故意输掉;而仅用了一年时间,我们已经能够坦然接受,并开始描绘人工智能带给人类美好未来的新蓝图……

这一次,人机大战来到了楚河汉界:一边是算法精密、“手眼协同”的下棋机器人,一边是年少有为、成绩显赫的冠军“棋王”。被称之为“继AlphaGo之后的人机大战2.0”,谁又能笑到最后?



与人对弈一样的感觉

谢靖对战的,是“元萝卜”的最高难度,第26关。

“在设计棋力的时候,我们希望从‘小白用户’到真正的高手,都能享受对弈的过程。因此设计了很宽的级别,在级与级之间有明显的棋力区分。”商汤科技创新工程院院长沈徽介绍。

这种说法得到了象棋国家大师董子仲的认可:“26关也不算很多,而且关与关之间的难度是层层递进的。关数太少,难度跨越就会很大。可能用不了两关,大家都过不去,就不爱坚持学了。”

1989年出生的谢靖,是上海最年轻的象棋特级大师。在很多人看来,谢靖挑战“元萝卜”26关,是真正的棋逢对手。在中国象棋史上,这亦是人类顶尖棋手与可自主完成感知、决策、控制全过程的下棋机器人的首次公开交锋。

战胜李世石和柯洁的AlphaGo,依靠的是连接着上千个中央处理器(CPU)和上百块图形处理器(GPU)、能耗接近人脑5万倍的超级计算机。尽管有真人代弈,可它终究还是冷冰冰的机器,与人类相比,感觉不到它对围棋的热情和热爱。或许,它的热情,只不过是运转速度过快导致CPU发热罢了。

与之不同,“元萝卜”是一台可摆放在家庭书桌上的实体机器人,外观酷萌。在与谢靖的巅峰对决前,来自上海的12—16岁青少年组冠军选手顾博文选择中等棋力的第16关率先出战,执红先行,以仙人指路强势开局;而“元萝卜”棋高一着,积极进攻,凭借强大的棋力水平,最终取得胜利。

“它带给了我和人对弈一样的感觉。”从5岁就开始下象棋的顾博文谈道。

“经过9个版本的产品迭代,我们仍然保留了机械臂形态,就是希望它像个真实的小伙伴,和人们交互。”沈徽说,这款AI机器人没有像手机、平板电脑那样的显示屏,在交互中不会损伤孩子的视力。

谢靖坐在了“元萝卜”对面,一脸云淡风轻。他执红先行,采用飞相局开局,“元萝卜”以中炮应对。

“象棋一开局,双方不存在防守和进攻。所谓进攻,必是占了优势方可进,若无优势也就没了所谓的进攻。”说这话的,是胡荣华。

比赛愈发精彩。



“堂堂正正”后的急转直下

巅峰对决通过网络直播。谢靖的老师,被誉为“象棋司令”的胡荣华来到比赛现场,关注着弟子的发挥。作为20世纪最杰出的象棋手之一,胡荣华曾14次夺得全国个人冠军,在1960年至1979年中创造十连冠纪录,是中国象棋界当之无愧的传奇人物。

“谢靖走了自己最擅长的棋路,他先求立于不败之地。”胡荣华看出了弟子的心思。

你来我往数个回合,“胡司令”又道:“红棋不差,没有废棋,每一步可以说都走得堂堂正正。”此时,“元萝卜”看起来占不到什么便宜。

2022年全国高考作文里,有道题目让人印象深刻——

“‘本手、妙手、俗手’是围棋的三个术语。本手是指合乎棋理的正规下法;妙手是指出人意料的精妙下法;俗手是指貌似合理,而从全局看通常会受损的下法……一般来说,对本手理解深刻,才可能出现妙手;否则,难免下出俗手,水平也不易提升。”

在红方平车捉炮后,“元萝卜”下出一招“妙手”——炮4平3,把炮下到红方马与黑方马之间,让谢靖顿时陷入思考。

“谢靖也不一定会想到!”胡荣华惊呼,此次比赛的棋手约定用时是各30分钟,黑方此招一出,谢靖出子速度慢了,“元萝卜”在马没有危险的情况下,已显优势。

时间已过去20分钟,红方逐渐陷入被动。谢靖右手托腮,身子俯得更低,似是想看清局中意,也想猜透对手心。“这个时候我知道自己可能稍微吃亏一些。中局一度觉得和棋有机会,但这可能也是人类棋手的错觉,在‘元萝卜’看来,这棋它其实已经拿捏住了。”赛后复盘时,谢靖坦言。

红方很顽强,可黑方的优势越来越明显。有段时间,谢靖落子很快,像是要拉回前面思考耗去的时间。

“憋得慌啊!”胡荣华也在为弟子着急。他分析局面,双方车、马、炮相当,都有边兵,但是红方少了一个相,“象棋象棋,象(相)很重要。有炮少个相,就像没了象鼻子,会呼吸困难。”

“难弄了……”胡荣华长叹一口气。



无论输赢 皆为传承

“和‘元萝卜’下棋,你不能亏一点,否则它就会‘得寸进尺’。”胡荣华有点无奈地笑道。

局面落后,在与“元萝卜”对弈38分钟后,谢靖推枰认负。

那有人类能掀翻“元萝卜”吗?胡荣华认为,国内等级分第一第二的棋手,先手可能还有机会弈和,但关键还是“不能亏”。他有些庆幸,“元萝卜”下的每一步还没有到人类看不懂的地步,“如果看不懂,那就说明差距大了”。相比人类,人工智能最大的优势就是不会疲劳,不会犯错——这一点在高水平的对弈中非常关键。

一周后,“元萝卜”挥师南下,登陆象棋大省广东,象棋大师曹岩磊出战。

擅长“弃子巧胜”的曹岩磊执红先行,以当头炮强势开局,双方互有攻守,势均力敌。中局时,曹岩磊一度占据上风,然而“元萝卜”走出令人出乎意料的“炮4平3”之“妙手”,阻止了红方势头,扭转局面。后续博弈中,双方均稳健出招,互相没有疏漏,最终激战成和。

这是后话了。

走下赛场,谢靖看上去心情还不错。从小就开始学棋,毋论输赢,都各有滋味,这也是自己所享受的。他觉得发挥得挺好,但“炮4平3”这个怪招实在是突破了人类棋手的思维模式。并且,人工智能“乘胜追击”的本事不小,“这盘棋我稍差一点点后,棋局就完全在它掌控之中了”。

不过,“元萝卜”的“剑走偏锋”,谢靖也不会刻意模仿,只会拿来参考。他说,还是非常开心能与“元萝卜”好好交流一盘棋。

沈徽介绍,研发团队利用深度学习、强化学习等人工智能技术,让“元萝卜”根据中国象棋规则自我对弈,同时学习人类棋手的棋谱,从而不断提升棋力。迄今为止,这款机器人“修炼”棋技的局数已经超过一亿,经过这种人类不可能承受的高强度训练,它达到了超越中国象棋特级大师的水平。

“‘元萝卜’棋力很深,走法干净,节奏紧凑。棋手与机器人的智勇攻守给我们留下了深刻的印象,这不仅是一场人类与人工智能技术的一次对弈,更是对象棋运动、象棋文化的一次有力宣传。比赛结果无论输赢,皆为传承。”胡荣华感慨。



创新娱乐吸粉无数

通过机器人头部天线上的摄像头,利用视觉AI算法,识别棋盘上的棋子位置及其变化情况,“元萝卜”能完成精准落子。它还贴心地根据对手的水平,动态调整下棋速度。同时,摄像头能精准判断障碍与遮挡,利用毫米级精度的操控算法,控制机械臂,保障下棋过程中的安全性。

而且,与“元萝卜”对弈就可完成中国象棋协会的专业课程,以及官方象棋等级考核中16级至13级的等级考试,并获得专业证书。要知道,中国象棋等级分为16级,最高等级为1级。孩子如果在“元萝卜”考级中被评为13级,也就达到了校队水平。

“象棋作为传统体育项目,不能只是囿于圈内的艺术,也需要一定观赏性,需要更多的观众。而人机对决这种形式可以让更多新一代年轻人感受到中国象棋的魅力,提高群众参与的热情,有望让中国象棋重新回到聚光灯下。”这是胡荣华留下的期待。

小小的棋盘,在不同的走棋组合中,蕴含着巨大的哲理,也有着无穷无尽的可能性。“元萝卜”落下的每一个子,走的每一小步,亦是家庭娱乐科技创新的每一道剪影。

沈徽挺喜欢到后台,翻翻用户的留言。

“我们家孩子以前对象棋完全不感兴趣,但是有了‘元萝卜’以后,整天晚上不睡觉也要下。”他看得挺高兴,不忘叮嘱,“觉还是要按时睡”。

科技的勃兴,重塑了人类情感沟通的桥梁。也有人传来一段视频,90多岁的老爷子赢了“元萝卜”,脸上露出了孩子般的笑容。拍视频的年轻人说,这是送给爷爷的生日礼物,老人家好下棋,可找到棋力相当、又不会摔棋盘的玩伴并不容易。沈徽又有些感动。

更多人问到,未来会加入围棋、飞行棋或国际象棋吗?有人畅想,若是推出麻将,买上三台,就能凑一桌了……

“这些反馈我们看到了,都很有意思。”他说,“我们会对可行性展开评估,推出大家喜爱的‘科技+亲和力’产品。”

放大

缩小

上一版

下一版

下载

读报纸首页