深入浅出谷歌人工智能围棋 “大脑”-人工智能-技术-爱吧机器人网

深入浅出谷歌人工智能围棋 “大脑”

2016-02-22 36氪浏览量：

　　落子选择器是怎么看到棋盘的？数字表示最强人类选手会下在哪些地方的可能。

　　团队通过在 KGS（网络围棋对战平台）上最强人类对手，百万级的对弈落子去训练大脑。这就是 AlphaGo 最像人的地方，目标是去学习那些顶尖高手的妙手。这个不是为了去下赢，而是去找一个跟人类高手同样的下一步落子。AlphaGo 落子选择器能正确符合 57%的人类高手。（不符合的不是意味着错误，有可能人类自己犯的失误）

　　更强的落子选择器

　　AlphaGo 系统事实上需要两个额外落子选择器的大脑。一个是 “强化学习的策略网络（Policy Network）”，通过百万级额外的模拟局来完成。你可以称之为更强的。比起基本的训练，只是教网络去模仿单一人类的落子，高级的训练会与每一个模拟棋局下到底，教网络最可能赢的下一手。Sliver 团队通过更强的落子选择器总结了百万级训练棋局，比他们之前版本又迭代了不少。

　　单单用这种落子选择器就已经是强大的对手了，可以到业余棋手的水平，或者说跟之前最强的围棋 AI 媲美。这里重点是这种落子选择器不会去 “读”。它就是简单审视从单一棋盘位置，再提出从那个位置分析出来的落子。它不会去模拟任何未来的走法。这展示了简单的深度神经网络学习的力量。

　　更快的落子选择器

　　AlphaGo 当然团队没有在这里止步。下面我会阐述是如何将阅读能力赋予 AI 的。为了做到这一点，他们需要更快版本的落子选择器大脑。越强的版本在耗时上越久－为了产生一个不错的落子也足够快了，但 “阅读结构” 需要去检查几千种落子可能性才能做决定。

　　Silver 团队建立简单的落子选择器去做出 “快速阅读” 的版本，他们称之为 “滚动网络”。简单版本是不会看整个 19*19 的棋盘，但会在对手之前下的和新下的棋子中考虑，观察一个更小的窗口。去掉部分落子选择器大脑会损失一些实力，但轻量级版本能够比之前快 1000 倍，这让 “阅读结构” 成了可能。

　　第二大脑：棋局评估器（Position Evaluator）

　　AlphaGo 的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步，它预测每一个棋手赢棋的可能，在给定棋子位置情况下。这 “局面评估器” 就是论文中提到的 “价值网络（Value Network）”，通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的，但对于阅读速度提高很有帮助。通过分类潜在的未来局面的 “好” 与 “坏”，AlphaGo 能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行，那么 AI 就跳过阅读在这一条线上的任何更多落子。

　　局面评估器是怎么看这个棋盘的。深蓝色表示下一步有利于赢棋的位置。

　　局面评估器也通过百万级别的棋局做训练。Silver 团队通过复制两个 AlphaGo 的最强落子选择器，精心挑选随机样本创造了这些局面。这里 AI 落子选择器在高效创建大规模数据集去训练局面评估器是非常有价值的。这种落子选择器让大家去模拟继续往下走的很多可能，从任意给定棋盘局面去猜测大致的双方赢棋概率。而人类的棋局还不够多恐怕难以完成这种训练。

精选推荐

美国普渡大学研发快动作软体机器人，灵感来自变色龙舌头捕食

[2019-10-31] 本文图片均来自：Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量，向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

机器人工程师具体都做什么？

[2017-12-08] 机器人工程师是幕后设计师，负责创建机器人和机器人系统，能够执行人类无法完成或不愿意完成的任务。通过他们的创造，机器人工程师帮助工作更安全，更轻松，更高效，特别是......

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

[2019-10-26] 谷歌刚刚宣布，其搜索引擎的核心算法正在进行一项重大升级，这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术（BERT ...

麻省理工学院最新研究：优化软体机器人的控制和设计

[2019-11-24] 软体机器人属于一个新的领域，它可能在诸如外科手术等领域发挥重要作用（手术时的纳米机器人需要在人体内部移动而不损伤软组织）。软体机器 ...

集群机器人领域最新研究：一种用于探测未知环境的微型无人机群

[2019-10-26] （图：无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向，它将试图飞到另一个方向。若首选方向冲突，低优先 ...

全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14] 美国Think Surgical公司已获得美国食品和药物管理局（FDA）的批准，在美国销售用于全膝关节置换（TKA）的TSolution One®全膝关节应用 ...

智能机器人困惑的时候知道该问什么问题

[2017-03-20] 照片：Nick Dentamaro 布朗大学上周，我们提到了麻省理工学院的一些研究，即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

通过对抗性图像黑入大脑

[2018-03-02] 在上面的图片中，左边是一张猫的照片。在右边，你能分辨出它是同一只猫的图片，还是一张看起来相似的狗的图片？这两张图片之间的区别在于， ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

OFO宣布进入4.0时代人工智能竟是这样找车

[2017-09-27] 9月26日，OFO小黄车召开发布会，宣布OFO将进入到用科技重新定义共享的4 0时代，作为此次发布会的重点，OFO小黄蜂也成为了众所关注的焦点， ...

英特尔研发新AI技术通过照片构建虚构场景

[2017-08-21] 近日，斯坦福大学和英特尔共同研发了一项技术。在向他们的人工智能系统输入5000张德国街道照片后，该技术可在人类的辅助下，让系统构建 ...

人工智能领衔未来生活智能硬件或迎转折

[2016-03-03] 　　智能家电转型升级，硬件+内容双管齐下　　在国家提倡互联网+战略的大背景下 ...

人工智能革命之下你会失业还是变得富有？

[2016-07-12] 最新一期的《经济学人》杂志的封面报道，将人工智能的发展对未来世界的影响和19世纪工业革命联系起来，机器的大规模应用是否会让工 ...

谷歌正打造能像人类一样快速学习的超速人工智能

[2017-03-23] 据Futurism报道，最近几个月，深度机器学习技术引发令人难以置信的喧嚣。广泛的能力让它们可以玩视频游戏、识别面部等，更重要的是可以自主 ...