Google能成为下一个世界围棋冠军吗？-企业-资讯-爱吧机器人网

Google能成为下一个世界围棋冠军吗？

2016-02-04 爱吧机器人网浏览量：

刘佳任绍敏

有着2500多年历史的围棋，一直被视作计算机最难以攻克的大众棋类。但现在，这一人工智能研究领域的“拦路虎”，开始遭遇强劲挑战。

1月28日，GoogleDeepMind团队宣布，他们研发的人工智能（ArtificialIntelligence，下称“AI”）程序AlphaGo，在没有任何让子的情况下以5∶0击败了欧洲围棋冠军职业围棋二段樊麾，同时也击败了目前最好的围棋程序中99.8%的对手。

果壳网新浪微博称：“围棋，人类已经下不过谷歌的AI了！”多年以后，当人类仰视AI的智慧时，准会想起谷歌推动黑白子的无形的手。围棋九段、第二届百灵杯世界冠军柯洁转发了上述微博，并评论说：“震惊！！赞！虽说看棋谱感觉水平有限……但可怕的是这还不是完全体，它是可以学习进化的……”

AlphaGo的下一个挑战将是世界顶级围棋选手之一李世石，这场对战将在今年3月进行。李世石是围棋九段高手，也是近10年来获得世界第一头衔最多的棋手，Google为此提供了100万美元作为奖金。

为什么围棋难以攻克？

1997年5月，象棋冠军加里·卡斯帕罗夫被IBM“深蓝”击败。今年3月，相似的历史还会重演吗？

“对于更加智能和灵活、具备与人类类似解决问题能力算法的开发工作而言，游戏无疑是一个绝佳的试验常”Google在官方博客中这样写道。

历史上，电脑最早掌握的第一款经典游戏是井字游戏，这是1952年一位博士在读生的研究项目；随后是1994年电脑程序Chinook成功挑战西洋跳棋游戏；3年后，IBM深蓝超级计算机在国际象棋比赛中战胜世界冠军加里·卡斯帕罗夫。

除了棋盘游戏外，IBM的Watson系统在2011年成功挑战老牌智力竞赛节目Jeopardy游戏一战成名；2014年，Google自己编写的算法，学会了仅需输入初始像素信息就能玩几十种Atari游戏。

但此前，有一项游戏仍然是人类代表着顶尖水平，那就是围棋。

围棋虽然看上去规则简单，却因为精妙而富有思想深度，几个世纪来都牢牢抓住了人们的想象力。

Google介绍说，围棋的搜索空间是漫无边际的——比围棋棋盘要大1个古戈尔（数量级单位，10的100次方，甚至比宇宙中的原子数量还要多）。因此，传统的“强力” 人工智能方法也就是“为所有可能的步数建立搜索树”，在围棋游戏中根本无法实现。

今年1月10日，卡耐基梅隆大学机器人系博士、Facebook 人工智能组研究员田渊栋曾在知乎中作答称，“围棋难的地方在于它的估值函数非常不平滑，差一个子盘面就可能天翻地覆，同时状态空间大，也没有全局的结构。这两点加起来，迫使目前计算机只能用穷举法并且因此进展缓慢。”

目前，Facebook的智能围棋darkforest最新的darkfmcts3在KGS围棋服务器上达到了5d，赢了一局Zen，输了一局给DolBaram，被让四子与一位韩国的职业六段一胜一负。

“现在的深度学习能在大量对局中找到这样的一些规律，但仍然没有人脑厉害。这一方面说明我们现在算法的局限性，另一方面它还有巨大的发展空间。”他说。

人工智能击败职业顶尖棋手真的快了吗？

知名少儿对弈平台新博围棋老总陈劲松在朋友圈评论说：“三个月以后，Deeplearning也许可以打败李世石，那也只不过是围棋高手队伍里面多了一个小伙伴而已，它学会了大家所有的招数。它同时还在等待学习你们发明的新的招数。”

职业二段棋手、围棋资深教练刘轶一对《第一财经日报》称，不用担心，不会那么容易。不过他所在的朋友圈里，围棋职业棋手们众说纷纭，有些认为不可能，有些认为指日可待了，还有声音是“人类快被自己灭绝了”。

击败欧洲围棋冠军

那么，人工智能程序AlphaGo是如何击败围棋高手的？

GoogleAlphaGo的研究者DavidSilver说，AlphaGo系统的关键是，将围棋巨大无比的搜索空间压缩到可控的范围之内。

而为了达到这一目的，AlphaGo系统将最先进的蒙特卡洛树状搜索技术与两个深层神经网络相结合，每个深层神经网络均包含许多层，每层又包含数以百万计的神经元一样的连接。

在AlphaGo两种不同的神经网络中，“策略网络（policynetwork）”的作用是预测下一步，并用来将搜索范围缩小至最有可能硬起的那些步骤。另一个神经网络 “价值网络（valuenetwork）”则是用来减少搜索树的深度，每走一步估算一次获胜方，而不是搜索所有结束棋局的途径。

上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如，深蓝采用强力方法搜索的棋子位置要比AlphaGo多数千倍。而AlphaGo则相反，它通过想象下完剩余棋局来对下一步进行预判，如此多次反复。在上述模拟游戏中，策略网络提出下一步的智能建议，而价值网络则对走过的每个位置进行评估。

具体而言，Google首先采用围棋专业棋手的3000万步下法对价值网络进行训练，直到该网络对人类下法预测准确率达到57%（AlphaGo之前的纪录是44%）。

但AlphaGo的目标是击败水平最高的人类棋手，而不仅仅是模仿他们。为了做到这一点，AlphaGo学会自己发现新策略，通过自身两个神经网络之间成千上万的对弈，采用被称为强化学习的试错法逐步进行改善。这种方法提高了策略网络的效率，以至于最原始的神经网络（即其中不包含任何树状搜索）可以击败最尖端、构建有巨大无比的搜索树的围棋软件。

这些策略网络又反过来对价值网络进行训练，采用的还是从自我对弈强化学习的方法。这些价值网络可以对围棋的任何位置进行评估并预测获胜方，而人们过去曾认为这个问题太过困难，根本无法实现。

精选推荐

麻省理工学院最新研究：优化软体机器人的控制和设计

[2019-11-24] 软体机器人属于一个新的领域，它可能在诸如外科手术等领域发挥重要作用（手术时的纳米机器人需要在人体内部移动而不损伤软组织）。软体机器 ...

Waymo：人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03] 自动驾驶汽车作为AI领域内最大的挑战之一，谷歌致力于其研发已有十余载，现在他们逐渐意识到，最困难的是如何让人们享受驾驶的乐趣。这是一 ...

受大脑控制的机器人

[2017-03-21] 想让机器人做我们想做的，首先，他得全面地了解我们。通常，这就意味着人类需要要付出更多。比如，教机器人复杂的人类语言或者把一项任务 ...

麻省理工正研究植物机器人让植物自主控制机器人

[2018-12-08] 控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人，但我们很少听说植物机器人对吧？一个机器人其实是对植物有很大益处的，因为一般植物根本无法移动......

九台“猎豹”机器人组队踢球，麻省理工高材生们的高级趣味

[2019-11-09] 本周，在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上，一群由人工智能驱动的机器人就是这场比赛的 ...

农业将为高科技行业农业机器人的应用领域

[2017-12-17] 农业正在迅速成为一个令人兴奋的高科技产业，吸引了新专业人士，新公司和新投资者。技术发展迅速，不仅提高了农民的生产能力，而且促进了我们所知道的机器人和自动化技术的发展。...

德国研发出一种能在你体内工作的微型机器人

[2018-01-26] 纽约时报的报道，德国的研究人员已经开发出一种长约七分之一英寸的机器人，首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路，跳跃，爬行，滚动和游泳。它甚至爬出......

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11] 苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点，但今年似乎正在加速。 4月份，公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证，而在6月份，苹果公司首席执行官库......

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

将NLU技术引入企业服务领域，ForeTHought获900万美元A轮融资

[2018-12-07] 近日， ForeTHought宣布已经获得了由New Enterprise Associates领投的900万美元A轮融资，该公司希望将NLU技术引入企业领域，致力于帮助“知识类专员”，例如客户服务代表等......

星逻智能发布无人机综合操作系统UltraHive Mk 3“启”

[2019-07-10] 6月20-22日，2019世界无人机大会在深圳隆重举办，来自国内外的四百多家企业参会，千余架无人机精彩亮相。为赋能无人机而生的星逻智能自然不 ...

分拣机器人创企Covariant B轮融资4000万美元！打包准确率达99%

[2020-05-08] 昨日，机器人创企Covariant宣布完成4000万美元B轮融资，以将其机器人控制系统引入更多行业，并开发出更多有拾取、放置和卸载仓库中物体功能 ...

双足机器人Cassie获投5000万致力于解决快递运送最后30米

[2018-04-17] 腿足机器人，一直以来都是一个神奇的存在。虽然近几年发展势头很猛，但除去应用于科研平台，很少有人把它真正应用于产业化（玩具类机器人除 ...

2019年亏损11亿元的寒武纪是否可以成为明日之芯？

[2020-04-03] 寒武纪是一家人工智能芯片设计商，主营业务为各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发生产销售。目前，寒武纪的主要 ...