2016年3月5日星期六

人类大战人工智能!世界顶尖棋手能否「捍卫」人类智商?


你可能不会下围棋,也对科技也不热衷,但5天后的这场围棋对决,全人类都不得不去关注。

北京时间3月9日中午12点,围棋传奇人物李世石将迎来「职业生涯中最重要的比赛之一」。李世石的比赛这么多,为什么就这场成了全世界的焦点?

因为李世石的对手不是人类,而是Google 研发一个计算机程序,它的名字叫AlphaGo。
 
回到19年前的1997年,同样有过这样一次世纪人机对决,不过主角是 IBM 的计算机「深蓝」以及棋王加里·卡斯帕罗夫,下的是国际象棋。

结果我们都知道了,这台重达 1270 公斤的「深蓝」战胜了棋王,计算机战胜了人类。而这一次,因为是代表全人类对阵计算机,李世石说他要誓死捍卫人类的智力:

对 AlphaGO 是我不能输的比赛,甚至一盘棋都不能输。

李世石何许人也?


不关注围棋的人可能不知道李世石。李世石是围棋专业九段棋手,这个段位已是专业围棋棋手中的最高级别。

当然,李世石厉害不在于他的段位,而是他能长年保持一流的水准,时常有神来之笔,兼有强大的战力且计算极为精准。

自2002年加冕富士通杯以来,他10年时间里共获14个世界冠军,是最近10年中获得世界第一头衔最多的棋手,公认的围棋传奇

同时,他有着高水准的心理质素,世界大赛上常在落后的情况下一次次地如同僵尸复活一样满血归来,并且总能在最后一刻反败为胜,因而棋风被人称为 ——「僵尸流」。



反观李世石对手,计算机程序AlphaGo来自围棋文化和实力并不发达的英国,研发时间不过两年左右。

今年1月份,Google对外宣布,AlphaGo于2015年10月份战胜了职业二段樊麾,这才声名大噪。职业二段樊麾出生于中国,目前是法国国家围棋队总教练,已经连续三年赢得欧洲围棋冠军的称号。

尽管战胜了樊麾,但AlphaGo的棋力在很多围棋职业棋手看来,仅仅「无限接近于职业」水平,而李世石则是棋坛传奇。

就是这么一场「实力悬殊」的比赛,却被不少媒体渲染为「李世石捍卫人类尊严之战」。

李世石虽传奇,可「人类尊严」为什么要靠一个围棋棋手捍卫?


要回答这个问题,我们首先要弄明白,下围棋对于一个计算机程序来说,是多么困难的一件事。

棋类游戏被视为顶级人类智力试金石,而围棋又是所有棋类游戏中最复杂的。


国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;而围棋每回合有250种可能,一盘棋可以长达150回合。

同时,围棋有3^361种局面,而可观测到的宇宙,原子数量才10^80。我们来看看一组衡量复杂度的数据对比:


计算机程序的强处是运算能力,但由于围棋太过复杂,只是依赖蛮算的话,效率非常低。而且,围棋中「虚」的东西非常多,计算机擅长逻辑运算,而不善掌握「虚无」的感觉。

在之前的围棋挑战赛中,由于计算机棋力比人类弱,人类选手都会让子,而且计算机程序主要和业余段位的棋手比赛。AlphaGo对战樊麾是完全公平的比赛,没有让子。

18年前,计算机就战胜了人类国际象棋棋王;18年后,计算机才在没有让子的情况下赢得和围棋专业二段选手的比赛。在这之前,业内人士普遍认为到达这一成就还要等上10年。至于 AlphaGo究竟是如何做到的,我们下文再详述。

总的来说,围棋大师是人类智力金字塔顶端的人物,而李世石更是大师中的传奇。AlphaGo 好不容易在没有让子的情况下打败职业棋手,再次主动挑战人类围棋传奇,将李世石对战 AlphaGo 描述成「捍卫人类尊严之战」并不为过。

AlphaGo 下的棋,连世界冠军都看不出来是计算机在操作


前面说到,超级计算机深蓝1997年击败了加里·卡斯帕罗夫。这与其说是计算机下国际象棋比人类厉害,不如说是靠计算能力欺负了人类

深蓝是专门针对卡斯帕罗夫棋风设计的弈棋软件,设计过程包含了对卡斯帕罗夫几乎全部对局的穷举分析。卡斯帕罗夫平均可以计算X回合后的Y个变化,深蓝则利用计算能力上的优势,推导出更多的变化。

所谓穷举,是一种数学计算方法,根据部分条件确定答案的大致范围,并在此范围内对所有可能的情况逐一验证,直到全部情况验证完毕。

比如,穷举应用在密码学上被称为暴力破解法。密码如果只有1位数字,穷举最多10次:1,2,3,4,5,6,7,8,9,0。2位数字的密码,穷举最多99次(00-99)就能破解。

然而穷举法应用在围棋上却非常的低效。上面说到,围棋每回合有 250 种可能,一盘棋可以长达 150 回合,有 3^361 种局面。单纯依靠蛮力去算,进展非常缓慢,永远也不可能击败人类大师。

AlphaGo 聪明的地方在于,加入了 「深度学习」技术,设法减少需要穷举的数量。深度学习能让机器在现有数据的基础上建立自己的逻辑,而不需要专家为每一个问题编写出一个专门的程序来解决。

AlphaGo的深度学习技术运用到了两个工具——「策略网络」着眼于当下,选择下一步走法。 「价值网络」思考得更加长远,预测棋局的走向。两个深度学习网络结合起来,大大增加了 AlphaGo 穷举的效率,使得计算机在围棋上战胜人类成为可能

(AlphaGo用到的两个深度学习网络,左边的是策略网络,右边的是价值网络)

要是还不能明白AlphaGo的厉害之处,我们看看果壳网曾经问过围棋天才柯洁的一个问题:「假如是不知情地去看AlphaGo和樊麾的这五盘棋,你会猜到AlphaGo不是人类吗?」

柯洁今年1月份刚刚击败了李世石,一年内三次夺得世界冠军。如果当初李世石没有应战AlphaGo,Google就会找柯洁了。他的回答是: 

完全看不出来。这五盘棋我也仔细地看了一眼,但我没看名字,不知道谁执黑谁执白,完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来出自程序之手。
因为之前的ZEN那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方下棋。它这个不会。它知道哪个地方重要,会在重要的地方下棋,不会突然短路。这一点是非常厉害的。

简而言之,AlphaGo不仅是遵循人工规则的计算机程序,它还能通过深度学习技术自行掌握如何赢得围棋比赛,是真正意义上的人工智能。并且它下的棋跟人类没什么两样,连世界冠军也看不出来。


人类 V.S. 计算机,谁的胜算更大?


这个问题其实见仁见智。

「围棋界人士都认为李世石会赢,不管是在感情上,还是棋力上。」国内知名围棋选手王煜辉七段告诉爱范儿。另一方面,不少计算机和人工智能科学家都希望AlphaGo可以战胜李世石。

回到2015年10月份AlphaGo对决樊麾那场比赛。

「从公布的棋谱来看,电脑的棋力大致相当于国内业余六段棋手的水平,而且可能还达不到强六(业余六段中的强者)的水平。」王煜辉这样评价AlphaGo。

柯洁则称「它(AlphaGo)的水平大概就是冲职业段之前的水平,虽然职业还到不了,但是无限接近于职业了」。樊麾作为一个职业二段棋手输给 AlphaGo,让不少业内人士感到意外。

不过,欧美棋手的段位含金量并不高,樊麾长期在海外,其棋力随时间增长反而会有下滑。柯洁在接受果壳专访时也提到,「可能是因为对手(樊麾)发挥得太糟糕了」。

来到2016年3月,时间已经过去了将近半年。中国计算机围棋智能第一人刘知青教授告诉爱范儿:

和樊麾的对决仅仅是小试牛刀,由于 Google 保密做得非常严,AlphaGo 棋力长进多少谁都不好说。

今年1月,DeepMind团队曾透露,AlphaGo在四周的时间里完成了100万局的自我对局,也就是说,它一天可以自我对局 3 万局。

韩国首尔科学综合研究生院大数据MBA主任教授金镇浩强调,去年10月为了战胜欧洲围棋冠军樊麾二段,给AlphaGo输入的并不是职业棋手的棋谱,而是 「欧洲业余高手」的16万局棋谱。

自去年10月以后,AlphaGO就以最高水准的职业棋谱为基础在学习。这意味着三月份AlphaGo出战之时,它的实际水平会令我们刮目相看。


(曾经的国际象棋棋王加里·卡斯帕罗夫)
不管最后李世石和AlphaGo谁赢了,这场世纪人机对决的影响力毋庸置疑,吸引了全世界对围棋、计算机和人工智能的关注。

1997年,全世界数百万人通过电视观看了一场惊人的胜利——一台计算机战胜了欲捍卫世界冠军称号的卡斯帕罗夫,此举震惊了国际象棋界。2016 年,我们有机会在5天后见证又一次世纪人机对决,成为历史的一部分。


比赛日程:
  • 3 月 9 日 (星期三):首场比赛
  • 3 月 10 日(星期四):第二场比赛
  • 3 月 12 日(星期六):第三场比赛
  • 3 月 13 日(星期日):第四场比赛
  • 3 月 15 日(星期二):第五场比赛
比赛将采用贴 7.5 目的中国规则,每位棋手各有两个小时布局时间,3 次 60 秒的读秒,每场比赛预计需要大约 4-5 个小时。爱范儿将对这场世纪对决进行滚动直播。


文章摘自ifanr爱范儿

没有评论:

发表评论