而蒙特卡洛算法出现后,凭借大量储备的棋局,通过胜负概率来判断下一步着点以作为计算方向,极大的提高的计算的效率,所以AI的水平才实现了革命性的进步。
而这次的AlphaGo,使用了深度神经网络与蒙特卡洛树状搜索相结合的方法。
依据已经能看到的Nature上的论文(可见雷锋网文章:《Google人工智能击败欧洲围棋冠军, AlphaGo 究竟是怎么做到的?》),研究者们在AlphaGo中加入了两个深度神经网络,以value networks来评估大量的选点,而以policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。
(注:上图为AlphaGo使用的神经网络结构示意图,来自原论文)
在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。
在蒙特卡洛算法之后,我看到了新的天地。这种结合以及新式的思路,让人感到前景无限。
最后谈一谈,我认为我们应该保有的态度。
如何面对人工智能?
这里,我首先想引用李喆七段在今天早上说的话:
“我们已来到两个时代的连接处,无论你是否愿意,这都是一个需要接受的事实。工具无善恶,善恶在人心。未来的路通往何方,将由我们自己决定。”
从凌晨到早上,朋友圈里的评论区一直争论不休,甚至某世界冠军一直在说“不信”,毕竟大家在没有看到板上的钉子之前,从情感上都是不愿意相信的。直到另外两位一线棋手告诉他,已经可以看到棋谱了......
面对这个事件,接下来将会有很多的爆炸性新闻报道,以及各种各样姿势的讨论。
我们要知道:
一.人工智能的确实现了很大的进步。
这次的进步可能是革命性的,这次新闻宣称的AI取得的成绩并不是“标题党”。
二.人工智能还没有战胜人类(什么所谓“人类最后的骄傲陷落”都属于“标题党”)。
但朝着这个方向迈出了一大步,而且是在很多人在蒙特卡洛之后不看好AI下一步发展的情况下,来了一个突然袭击(谷歌从开始研究到出成果再到发布,一直憋一个大新闻憋这么久也真是能忍)。
三.人工智能战胜人类的时点,可能比很多人想象的要来得更早了。
不是之前设想的生物计算机或者量子计算机出现后,甚至都不是新材料取代硅晶片之后,在这个时代就有可能出现了。也许是五十年后,也许是二十年后,甚至可能是十年后。
从小学时开始,我就痴迷于许峰雄教授对于计算机国际象棋项目的研究和成就,一直追踪到97年“深蓝”战胜卡斯帕罗夫。(就是在那之后不久,我才从国际象棋转投了围棋......)
(注:上图为第一个打败人类的计算机国际象棋程序“深蓝”之父——许峰雄)
从中学时代到大学时代,我一直追寻着许教授的动态和他撰写的各种文章、书籍,他写的《“深蓝”揭秘》被我翻的都烂了,我甚至在中学时代一直想以此作为未来的求学从研的方向。
许教授离开IBM、前往亚研院并声称准备致力于作为最终问题的计算机围棋难题之后,我仍然一年年心心念念的期待着许教授的后续动作。
然而十多年过去,等来的却是无数的后来者。
这也挺好,人类就是不缺后来者。
看许教授对当年研究过程的讲述,最大的感受就是:
其实并不是计算机打败了人类,而是人类打败了人类。
大量的计算机专家,配合大量的国际象棋职业棋手,在算法上不断革新,再搭乘上摩尔定律的东风,不断的失败再重来、输了再修正,最终才解决了计算机国际象棋难题。
卡斯帕罗夫,是败给了数以百计的人类专家的智慧的合力。
围棋也会是一样,计算机——今天说人工智能更合适,战胜人类的那一天迟早会来,大部分人都从来不否认这一点。
争论,始终在于这一天的早晚。
而棋手和围棋从业者们,出于可以理解的感情,总是希望并认为这一天不会来得那么快,但他们绝对不会拒绝甚至仇视这种进步。
其实我看到的很多人,都一直期待并赞许着人工智能的进步,甚至很多职业高手还亲身参与和帮助着计算机围棋项目的研究。我们努力打造着一个“大玩具”,一个能战胜自己的“大玩具”。
所以最终的成功,是我们人类自己的成功,而不应该对计算机感到恐惧。
同时,这“大玩具”也不只是好玩而已,人工智能对于现代乃至未来科技的发展有着极大的意义,这意义甚至会超出当年原子弹研究的后续红利。
所以不要害怕,不要烦恼,让我们期待着人工智能在围棋上战胜人类的那一天的到来吧。
我之前一直认为在我有生之年是看不到这一天的,然而现在看来,我错了。
我一点也不失望,反而感到很兴奋,很激动,并且期待着以google和facebook为首的前沿研究团队们的进一步的表现。最后的最后,恭喜谷歌,恭喜围棋,恭喜人类。