爱吧机器人网 » 分类 > 特种机器人 > 正文

RoboSumo 让机器人懂得探索学习

传统的机器人虽然智能,但是却并没有“学习”的本领,它们往往依靠人工操作,你可以将它看做是一款智能机器人,但是说到底,它却还是人手中的“牵线傀儡”。而现如今的机器人,在智能上却已经得到了大大的升级,它们不再是人类的附属品,它们也拥有学习的本领,撇开人工操控,它们在不断的摸索中进行学习,以获取某种本领。

在RoboSumo虚拟世界中战斗的机器人由机器学习软件控制,而非人类操控。与典型电子游戏中的电脑角色不同,他们并没有被预先编程去进行摔跤搏斗;相反,他们必须在反复摸索中“学习”这项运动。该游戏由Elon Musk共同发起的非营利研究实验室OpenAI开发,希望借助人工智能系统让机器人变得更加智能聪明。

机器人

OpenAI的研究员Igor Mordatch表示,因为人工智能代理面临对手造成的复杂,变化的环境,所以这样的比赛会带来一种智力军备竞赛。这可能有助于学习软件学到对控制机器人和其他现实世界任务有价值的复杂技能。

在OpenAI的实验中,简单的人形机器人进入到竞技场,它们甚至不知道如何行走。这些机器人有通过反复试验进行学习的能力,有学习四处移动,打败对手的目标。经过大约十亿次的实验,机器人开发了一些策略,比如,蹲下来让自己更加稳固,诱使对手从拳击场掉落到地面上。研究人员开发了新的学习算法,让玩家能够在一场比赛中调整自己的策略,甚至预测对手何时可能会改变战术。

OpenAI的项目例证了,人工智能研究人员如何试图避免使用率最高的多种机器学习软件的局限性,该软件通过处理大量的标签示例数据获得新技能。这种方法推动了翻译,语音和面部识别等领域的进展。但是,对于让人工智能应用的更为广泛的复杂技能来说,例如通过控制家用机器人,这种方法却是不实际的。

研发更灵巧的人工智能的一个可能途径就是强化学习,软件利用反复试验来实现特定的目标。这就是DeepMind(谷歌收购的伦敦人工智能初创公司)如何让软件控制Atari游戏的方式。该技术现在被用于让软件开始处理更为复杂的问题,例如让机器人捡起物品。

OpenAI的研究人员之所以创建RoboSumo,原因是,他们认为与让强化学习软件单独处理更为复杂的问题相比,由竞争带来的额外复杂性可能会得到更快的进步。卡耐基梅隆大学研究生Maruan Al-Shedivat说:“当你与其他代理进行互动时,你必须适应。如果不这样做,你就会失败。”Maruan Al-Shedivat在OpenAI实习期间参与了RoboSumo的工作。

OpenAI的研究人员也用蜘蛛状的机器人以及其他的游戏(如简单的足球罚球)来测验了这一想法。OpenAI发布了两篇研究论文,有关与人工智能代理进行比赛的工作,以及RoboSumo,其他一些游戏和几位专业球员的代码,。

相扑摔跤可能不是智能机器可以为我们做的最重要的事情。但是,OpenAI的一些实验表明,在一个虚拟竞技场中学到的技能可以转移到其他情境中。当把机器人从相扑场地运送到具有强风的虚拟世界时,机器人还会支撑住保持直立。这表明它已经学会了用普通的方式来控制身体和平衡。

将虚拟世界的技能转化为真实的技能是一个完全不同的挑战。德克萨斯大学奥斯汀分校教授Peter Stone表示,在虚拟环境下工作的控制系统在物理机器人身体中通常都不起作用——这个尚未解决的问题被称为“现实差距”。

尽管尚未公布任何突破,但OpenAI的研究人员仍在研究这一问题。与此同时,Mordatch想给他的虚拟类人生物更多的动力做更多的事情,而不仅仅是进行比赛。他正在考虑一个完整的足球比赛,在比赛中,代理也都必须合作。


上一篇:索尼将推犬型家用机器人 拥有宠物狗魅力
下一篇:DNA机器人:步子小 却能涉及人类去不到的地方
精选推荐
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

这些人型机器人是如此真实,你的肉眼几乎无法区分
这些人型机器人是如此真实,你的肉眼几乎无法区分

[2017-09-03]   我们生活在一个区分现实与幻想变得越来越困难的世界。由于机器人技术的进步,创造人工的人类正在逐渐接近完美的最终目标。我们现在看到的机器人不再只是一块发光二极管,......

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

本周栏目热点

麻省理工学院制造透明机器人,可在水下捉鱼

[2018-12-19]  麻省理工学院(MIT)的工程师们制造了透明的水凝胶机器人,通过泵入或泵出水来实现机器人的移动。该机器人可以执行许多快速且需要“力气”的任务,例如在水下踢球、抓放小鱼。...

[1970-01-01]    随着中国制造2025的持续升温,机器人制造正成为我国新一轮的热门话题。打上航天制造标签的机器人已悄然走入诸多领域,航天科技集团机械 ...

加州枪击事件反思:全球排爆机器人大盘点

[2015-12-11]     近日,枪击突发事件引起了全球的强烈关注。继巴黎11月13日恐怖枪击事件后, ...

我花了一星期时间,与5个智能聊天机器人在一起……

[2018-01-19]  我饿了,我问chatbot冰箱里有什么,它告诉我有一个我做的熏肉、生菜和番茄三明治。然后,我感到无聊,就把电影推荐智能工具And Chill打开...

新闻不用看的用聊的?Quartz机器人越来越人性化

[2016-09-22]  数字商业新闻网站Quartz已经推出超有未来范儿的同名新闻移动应用,无需用户自己去看新闻,它可通过类似好友聊天的方式帮你解读新 ...