冷扑大师背后的AI算法和博弈论：CFR算法是核心-人工智能-技术-爱吧机器人网

冷扑大师背后的AI算法和博弈论：CFR算法是核心

2017-04-11 量子位浏览量：

量子位报道 | 公众号QbitAI

昨天下午，量子位在中关村举办了一个技术沙龙，邀请创新工场AI工程院技术VP李天放、联想智慧医疗CEO林林等，从技术和实战的角度，对德州扑克人机大战进行解读。

以下是李天放对德州扑克AI的技术解读：

文字版本整理如下：

AI算法和博弈论，这两个交叉点还是有一点难度的。

先从博弈论开始。

大家需要对GTO/纳什平衡有一个初期的理解。在德州扑克，翻硬币，剪刀石头布这类游戏里面，纳什平衡点的定义是：如果双方都在用一个比较好的战略，任何一方做出调整结果都会更糟糕，也就是存在一个平衡点，使得两个人都不能再进步。

我们用一个简单的游戏解释。

如果我们玩一手剪刀石头布，可能靠运气；玩二十万手，就要看战略是什么。如果我们想解这个问题，也是很简单，下面这个就是所谓的完美战略：

· 33%剪刀33%石头33%布

· 无论对手用什么战略，都不可能战胜我们

· 但我们也赢不了…

然而想要接近一个真正的完美战略是非常难的，大部分人有些偏好，更接近的可能是这样一个情况，对手比较笨不知道能出剪刀：

· 假设对手#1：从来不出剪刀，50%布，50%石头

· 我们的老战略有问题么？（各33%）

老战略可能还是不输的，但也不是最佳战略(GTO)。纳什平衡的意思是双方都不能改进，如果知道对手从来不出剪刀，我们的战略是能改进的。针对上面的对手#1，我们的战略可以改成：50%剪刀，50%布。

为什么不用100%布的战略？因为对方可能也调整成100%布。使用50%剪刀，50%布的战略至少可以比打平做的更好。

从博弈论来说，我们找到了对手的弱点，但没有暴露自己的弱点。也就是说，我们找到了一个新的平衡点。

这就是Libratus在做的事情。

相比于石头剪刀布，一对一的德州扑克，是一个复杂度非常高的博弈。如何找到德州扑克的GTO和纳什平衡点？这是此类AI算法的核心。

CounterFactual Regret Minimization(CFR，反事实遗憾最小化)，这是一个类似强化学习的算法，但是更高效。让AI之间对战德扑，采用随机的策略，然后每局过后看看在什么地方后悔了，然后尝试不同的战略，再在决策点上复盘。

这个算法与人类学习德州类似：累积经验、评判自己的选择，但需要注意的是，这里正确的“后悔点”非常重要。德州扑克有很强的随机性，所以很容易陷入错误的学习方式。

算法很简单，问题是无限德州的空间太大了，复杂度是10的160次方。有几种解决方案：合并简化+CFR(Claudico)，CFR+“直觉”(DeepStack)，CFR+End Game Solver+RL(Libratus)。

总结一下：

· CFR类似于强化学习。权重调整基于概率。

· AI的战略和学习方式和职业牌手相似，但是更准确。

精选推荐

美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08] 随着无人机及其组件越来越小，效率越来越高，功能越来越强大，我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中，而不依赖于外部定位。宾夕法尼亚大学在......

担心机器换人？自1950年以来只有一个职业被机器彻底取代

[2017-03-21] 虽然有很多关于机器人取代工人的担心，但哈佛经济学家James Bessen的论文指出，在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

[2019-10-26] 谷歌刚刚宣布，其搜索引擎的核心算法正在进行一项重大升级，这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术（BERT ...

新型轻便机器人套装重5kg，辅助跑步和步行

[2019-10-23] 虽然步行对大多数人来说似乎不是负担，但对有些人来说，这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

瑞士研发出微型机器人集群可像蚂蚁一样互相交流并协同工作

[2019-07-12] EPFL（瑞士联邦理工学院）的研究人员受到了蚂蚁的启发，开发了一款仅有10克重的小型机器人：他们可以相互交流，分配角色并完成复杂的任务。 ...

2018年企业数字化转型的五大趋势

[2017-12-16] 据2016年哈佛商学院研究表明，选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升，相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊，也曾是收入处于......

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24] 机器人的研究在过去10年中得益于一个具有嵌入式人工智能（AI）的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建，如今在欧洲、美国、韩国、新加坡和日本的实验室......

美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11] 人工智能在当今这个时代对大家来说想必是非常熟悉的，这也是我国近十几年来一直追求的目标，未来的时间里这也将是全人类追求的目标。就目前来看，近年来，人工智能或在我国迎......

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

英特尔研发新AI技术通过照片构建虚构场景

[2017-08-21] 近日，斯坦福大学和英特尔共同研发了一项技术。在向他们的人工智能系统输入5000张德国街道照片后，该技术可在人类的辅助下，让系统构建 ...

OFO宣布进入4.0时代人工智能竟是这样找车

[2017-09-27] 9月26日，OFO小黄车召开发布会，宣布OFO将进入到用科技重新定义共享的4 0时代，作为此次发布会的重点，OFO小黄蜂也成为了众所关注的焦点， ...

人工智能领衔未来生活智能硬件或迎转折

[2016-03-03] 　　智能家电转型升级，硬件+内容双管齐下　　在国家提倡互联网+战略的大背景下 ...

人工智能革命之下你会失业还是变得富有？

[2016-07-12] 最新一期的《经济学人》杂志的封面报道，将人工智能的发展对未来世界的影响和19世纪工业革命联系起来，机器的大规模应用是否会让工 ...

谷歌正打造能像人类一样快速学习的超速人工智能

[2017-03-23] 据Futurism报道，最近几个月，深度机器学习技术引发令人难以置信的喧嚣。广泛的能力让它们可以玩视频游戏、识别面部等，更重要的是可以自主 ...