Go Alpha Go !

2016-03-15

不到一周时间,阿尔法狗貌似已经家喻户晓了。

阿尔法狗,大名AlphaGo,是由Google公司位于伦敦的DeepMind团队开发出的一款人工智能计算机围棋程序。

它将树型搜索与两个深度神经网络相结合。通过策略网络提供落子直觉,通过价值网络提供局面判断直觉,并使用蒙特卡洛树型选择来验证。在实践上它不仅从其数据库中学习了人类对局棋谱中的3000万步招法,还通过不断自我对弈更多的棋局来学习并提升策略。阿尔法狗曾于2015年10月以5:0战胜了欧洲围棋冠军、职业二段樊麾。这是计算机程序首次在十九路棋盘无让子的情况下战胜人类职业棋手。

这一周来在韩国首尔四季酒店进行的AlphaGo vs. 李世石的五番棋挑战赛中,阿尔法狗取得了前三局和第五局的胜利,仅在第四局中被李世石盘中逆转。最终阿尔法狗以总比分4:1取得了这场人机对决的胜利,这也是计算机程序首次战胜人类九段职业棋手,韩国棋院为此授予AlphaGo荣誉九段。

AlphaGo vs. 李世石 第四局 实战棋谱

其实从几局的对奕中,我们也可以洞察出一些阿尔法狗的策略特点,比如:

  1. 它并不追求最好的下法,而是追求离胜利最近的下法——也就是最稳的下法。
  2.  一些人类棋手会保留的交换,它会先走掉——只要它认为不会亏的先手,往往它会先走掉,目的是简化局势,从而减少分支数量。
  3. 全局观上,有时它会从眼前的短兵相接中脱先,去解决一个在它看来更为重要的问题,比如另一块更大的棋的安全保障问题。
  4. 劫争的处理,它会先把自己的弱处补强,确保没有后患再跟你打劫,以免落为对手的劫材。
  5. 从第四局李世石的白78手逆转来看,它的策略网络也会有盲区——比如一个绝不会有人走的位置,它有可能压根就没有去计算这个分支。
  6. 在判断自己处于不利的局面时,它会走出一些非正常的奇怪招术——也许是随机博概率,也许是它看过的棋谱中有这样很业余但却最终取胜了的下法。
  7. 在不利局面下的收官时可能会尝试一些投机性的招法,比如主动去扑看你提不提,其实就是去堵一下你万一不应的概率——在它看来那也有取胜的机会。

我觉得机器展现出的某些特点,是值得人类棋手好好思考和学习的,比如全局观,比如先机与后患,比如胜的多还是胜得稳等问题。

更重要的是,人类总会有失误会有各种情绪状态,会有局面好转而带来的窃喜与松懈,还会有脑力体力的极限。而机器没有包袱,不会紧张,也不会骄傲,它甚至不会疲劳。在各种体育竞技里我们都常说,要有良好的心理素质,不以物喜不以己悲,不受压力影响,把每一分都当作第一分去拼。人类这些往往只是说说,真正能做到的少之又少,而机器却恰能如此。

许多人开始担心起人工智能可怕的一面,比如AlphaGo背后的深度学习模型——这种深度学习是具有通用性的。也就是说,机器它不光可以学会下围棋,还可能学习驾驶技术然后去和韩寒跑一场汽车拉力赛,甚至学会驾驶无人机去寻找什么什么目标也不是不可能的……

但是,我依然觉得,在创造性的领域,人工智能还和人类智能的水平差的很远,比如它会写小说吗?会作曲填词吗?会撩妹追姑娘吗?

另外,中国的90后九段棋手柯洁12日阿尔法狗刚取得3:0领先的当天晚上发出微博向它约战:

来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧!这个B我就装了怎样!

说实话我也挺想见识一下阿尔法狗与柯洁的对战,据说柯洁除了下棋之外还会卖萌。

One more thing,今天看柯洁在接受采访时说:

机器的一个特点是寻求简化局面,所以它常会不保留交换、避免劫争,这说明机器害怕复杂麻烦的局面,这正是它的弱点。

如果不久的将来他们之间有对局,希望看到柯洁以出色的实力和战略为人类棋手扳回一城。同时也希望AlphaGo继续进步,狗狗你大胆地往前走。