爱吧机器人网 » 专题 > 观点 > 正文

AI和深度学习如何给游戏带来生命?

想了解更多的使用深度学习来开发数字化体验的内容,请查看Danny Lange在2017年9月17-20日人工智能旧金山大会上的议题《使用深度学习给游戏、VR和AR带来生命》。

游戏开发是一个复杂且劳动密集型的工作。游戏的环境、故事线和人物个性都需要被仔细地构建。这需要视觉艺术家、编故事的人和软件工程师一起密切协作才能完成。通常,在传统编程的形式下,游戏会有一套专门编写的行为;或是在有大量规则组合的形式下,会以更加有反馈的行为来构成。在过去的几年间,数据密集的机器学习解决方案已经在企业(比如Amazon、Netflix和Uber)里消灭掉了基于规则的系统。在Unity,我们已经在探索使用这样的一些机器学习的技术,比如用深度学习做内容构建,用深度增强学习来进行游戏开发。我们已经看到这一波的机器学习和人工智能在游戏领域的巨大潜力。

对于一些数据驱动的大型企业而言,机器学习并不是什么新东西。2007年,当Netflix发起了著名的Netflix Prize竞赛,让最好的协同过滤算法来预测用户对 电影 的评分时,就是我们现在所体验的对人工智能的大量媒体报道的开端。但是在2000年初,一些大企业就已经在尝试使用数据驱动的决策和机器学习来提升业务了。Amazon已经非常努力地开发他们自己的推荐算法,尝试去发现用户的偏好,进而把这些偏好转化成更高的销售业绩。广告业的技术则是另外一种早期采用机器学习者,机器学习被用来提升点击率(CTR)。在过去的这些年里,机器学习技术已经成熟并扩散到非常多的行业。

例如,推荐算法已经从仅仅通过推荐来探求更多的信息发展到了探索和搜索的组合。这里的挑战是,当Amazon和Netflix使用推荐系统来收集数据时,如果他们仅仅是给用户推荐高得分的物品,而不是他们商品目录里的其他物品,他们获得的是一个不完整的用户偏好。这一问题的解决方案是微妙地从纯搜索变化到添加一些因素来探索。

最近,因为它们内在的可以探索和搜索的特性,诸如上下文老虎机这样的算法变的流行起来。这些算法可以更好地学习到它们还不了解的客户的东西。相信我,在你访问的很多Amazon网页的背后都潜伏着老虎机算法。我们在Unity的博客上有一篇不错的文章介绍上下文老虎机算法的威力。里面有一个对上下文老虎机算法的交互展示。

在2015年初,DeepMind将上下文老虎机算法进一步发展,并发表了一篇论文。其中介绍了一个把深度神经网络和增强学习组合起来的大规模系统。这个系统可以精通Atari的2600个游戏里的很多个,还仅仅只是依靠原始像素和得分作为输入就能取得超越人类的水平。DeepMind的家伙把探索和搜索的概念变成了兴奋剂。虽然上下文老虎机在学习行为上还比较得浅,但深度增强学习则能够学习一系列的行为用以最大化未来的累积收益。换句话说就是,它们可以学习优化长期价值(LTV)的行为。在一些Atari的游戏里,LTV通常是只有人类玩家掌握的一些策略发展。看这里的一个Breakout游戏的视屏来了解这种策略发展的例子。

在Unity,我们问自己如何才能让一只小鸡学会穿过一条交通繁忙的道路而不被来往的卡车撞死,同时还能收集礼物包。我们用了一个通用的和DeepMind的试验类似的增强学习算法。它会给小鸡一个正分如果它收集了一个礼物包,一个负分如果它被卡车撞死。另外,我们给小鸡四种可能的行动:向前、后、左、右移动。仅仅使用图像的像素和得分作为输入,以及这些非常简单的移动指示,在6个小时的训练后,小鸡就获得了超越人类的水平。可以在这里看相关的 视频 :

我们具体是怎么实现这一切的?实际上很简单。一套Python的API让我们可以把Unity的游戏与运行在Amazon云服务(Amazon Web Services,AWS)上的TensorFlow的服务连接起来。TensorFlow是Google在2015年发布的一个深度学习的框架。如你在这个 视频 里看到的,在训练的早期阶段,小鸡主要是在进行探索。但随着学习的深入,它逐渐地转变到搜索了。可以看到这一学习系统的一个重要能力就是它能成功地应对“没见过的”情形。卡车出现和礼物包的位置的组合是完全随机的。当小鸡被训练了几个小时候后,统计意义上它还是会持续地的碰到没有见过的场景。我们的Python API能很容易地从游戏里读取游戏框架和内部状态,并使用机器学习模型来反向控制游戏里的代理(比如小鸡)。

现在让我们对小鸡和它超人的能力做一个反思。小鸡游戏自身只是提醒了我们Amazon、Netflix和Uber是如何使用相同的技术来更好地服务他们的客户(不管是Uber的无缝载客体验或是Netflix给我展示按照我的口味定制的内容),不过它的确打开了在游戏开发中使用训练而不是硬编码的大门。

设想一下在游戏里训练一个非玩家角色(NPC, non-player character),而不是去编码它的行为。游戏开发人员需要做的会涉及到创建一个NPC需要被训练的游戏场景,他们会使用前面提到的Python API连接云端的增强学习的环境来进行这个训练。这个场景可以是完全人工设计的,或者是有NPC要去学习的一群人类玩家参与的。当NPC的表现令人满意后,另外一套Unity的API会允许开发人员直接把TensorFlow的模型嵌入到他们的游戏里面去,从而消除了需要继续把游戏连接到云端的TensorFlow服务的需求。

一些游戏开发人员可能会说他们在10到15年前最后尝试机器学习时“就已经这样做了”。但那是一个不一样的时代。那时候,通过富于表达的循环神经网络(RNN)——比如长短期记忆(LSTM)——来学习序列数据,以及通过卷积神经网络(CNN)来学习空间特征等技术都已经被发明出来了。但缺乏计算能力以及缺乏可扩展和精细的软件框架阻止了这些技术在实际中的成功 应用 ,以及在诸如游戏开发这样有需求的行业里被采用。

在游戏开发里使用深度增强学习依然处于它的早期阶段。但对我们而言一切正在变得很清晰:类似于在其他大型企业里被证明的一样,这是一个潜在的颠覆性游戏技术。诸如TensorFlow这样成熟的、可扩展的、运行在云端并有集成的API接口的机器学习框架正在降低游戏开发人员和机器学习研究人员进入这个领域的门槛。正如机器学习正在进入企业的每个角落一样,你应该也会期待在你的下一个游戏里面机器学习会无处不在。

This article originally appeared in English: "Bringing gaming to life with AI and deep learning".


上一篇:手机AI是蓝海也是血海
下一篇:AI助力机器人执掌全球?科学家称人类将陷入绝境
精选推荐
2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

美国Natilus公司试飞水上无人货机 设计简单成本降低
美国Natilus公司试飞水上无人货机 设计简单成本降低

[2017-12-28]  Natilus创业公司成立于2014年,其梦想是建造大型无人机,以半价提供比船舶快得多国际货运。在十二月份,Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

CES 2018:英特尔推出49量子位芯片争夺量子霸权
CES 2018:英特尔推出49量子位芯片争夺量子霸权

[2018-01-10]  在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中,英特尔通过了一个关键的里程碑。近日,这个科技巨头已经推出了一个49个量子位 ...

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

本周栏目热点

创新推动以机器人为代表的智能装备制造业发展

[1970-01-01]    目前,中国已有机器人生产企业100多家,国内包括天津、重庆、上海、江苏以及广州等地,在当地政府部门的强力支持下都在大力发展自动装 ...

Jeff Dean:谷歌翻译API才9月就已获利

[2017-09-30]  很多人看来,人工智能一直都是停滞不前的,虽然研发出来的成果不少,但是接近现实,真正投放入现实的,却为数不多,不过在2016年9月,谷歌 ...

【专访】佛山需稳扎机器人等市场 期待更多本土跨国公司

[2015-12-10]     佛山处在改革开放前沿,此次跨国调研活动动作快,一定会引起全国关注。12月 ...

[1970-01-01]    机器和机器人把人从繁重的体力劳动和枯燥的工作中解放出来,去干更重要的工作,或者让人成为监工,监督机器人干活。这是一个美好的前景 ...

[2016-09-03]   60年多前的夏天,麻省理工学院里的几个计算机系的教授聚在一起,第一次提到了人工智能这个词。当时他们以为,用一个夏天的时间,就可 ...