爱吧机器人网 » 分类 > 特种机器人 > 正文

RoboSumo 让机器人懂得探索学习

传统的机器人虽然智能,但是却并没有“学习”的本领,它们往往依靠人工操作,你可以将它看做是一款智能机器人,但是说到底,它却还是人手中的“牵线傀儡”。而现如今的机器人,在智能上却已经得到了大大的升级,它们不再是人类的附属品,它们也拥有学习的本领,撇开人工操控,它们在不断的摸索中进行学习,以获取某种本领。

在RoboSumo虚拟世界中战斗的机器人由机器学习软件控制,而非人类操控。与典型电子游戏中的电脑角色不同,他们并没有被预先编程去进行摔跤搏斗;相反,他们必须在反复摸索中“学习”这项运动。该游戏由Elon Musk共同发起的非营利研究实验室OpenAI开发,希望借助人工智能系统让机器人变得更加智能聪明。

机器人

OpenAI的研究员Igor Mordatch表示,因为人工智能代理面临对手造成的复杂,变化的环境,所以这样的比赛会带来一种智力军备竞赛。这可能有助于学习软件学到对控制机器人和其他现实世界任务有价值的复杂技能。

在OpenAI的实验中,简单的人形机器人进入到竞技场,它们甚至不知道如何行走。这些机器人有通过反复试验进行学习的能力,有学习四处移动,打败对手的目标。经过大约十亿次的实验,机器人开发了一些策略,比如,蹲下来让自己更加稳固,诱使对手从拳击场掉落到地面上。研究人员开发了新的学习算法,让玩家能够在一场比赛中调整自己的策略,甚至预测对手何时可能会改变战术。

OpenAI的项目例证了,人工智能研究人员如何试图避免使用率最高的多种机器学习软件的局限性,该软件通过处理大量的标签示例数据获得新技能。这种方法推动了翻译,语音和面部识别等领域的进展。但是,对于让人工智能应用的更为广泛的复杂技能来说,例如通过控制家用机器人,这种方法却是不实际的。

研发更灵巧的人工智能的一个可能途径就是强化学习,软件利用反复试验来实现特定的目标。这就是DeepMind(谷歌收购的伦敦人工智能初创公司)如何让软件控制Atari游戏的方式。该技术现在被用于让软件开始处理更为复杂的问题,例如让机器人捡起物品。

OpenAI的研究人员之所以创建RoboSumo,原因是,他们认为与让强化学习软件单独处理更为复杂的问题相比,由竞争带来的额外复杂性可能会得到更快的进步。卡耐基梅隆大学研究生Maruan Al-Shedivat说:“当你与其他代理进行互动时,你必须适应。如果不这样做,你就会失败。”Maruan Al-Shedivat在OpenAI实习期间参与了RoboSumo的工作。

OpenAI的研究人员也用蜘蛛状的机器人以及其他的游戏(如简单的足球罚球)来测验了这一想法。OpenAI发布了两篇研究论文,有关与人工智能代理进行比赛的工作,以及RoboSumo,其他一些游戏和几位专业球员的代码,。

相扑摔跤可能不是智能机器可以为我们做的最重要的事情。但是,OpenAI的一些实验表明,在一个虚拟竞技场中学到的技能可以转移到其他情境中。当把机器人从相扑场地运送到具有强风的虚拟世界时,机器人还会支撑住保持直立。这表明它已经学会了用普通的方式来控制身体和平衡。

将虚拟世界的技能转化为真实的技能是一个完全不同的挑战。德克萨斯大学奥斯汀分校教授Peter Stone表示,在虚拟环境下工作的控制系统在物理机器人身体中通常都不起作用——这个尚未解决的问题被称为“现实差距”。

尽管尚未公布任何突破,但OpenAI的研究人员仍在研究这一问题。与此同时,Mordatch想给他的虚拟类人生物更多的动力做更多的事情,而不仅仅是进行比赛。他正在考虑一个完整的足球比赛,在比赛中,代理也都必须合作。


上一篇:索尼将推犬型家用机器人 拥有宠物狗魅力
下一篇:DNA机器人:步子小 却能涉及人类去不到的地方
精选推荐
哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤
哈佛大学《自然》发表新驱动技术,让飞行机器人悬停且不受损伤

[2019-11-06]  哈佛大学研究人员发表在《自然》杂志上的一项最新研究,他们开发了一种由柔软的人造肌肉驱动的机器人蜜蜂(RoboBee),这种机器人在撞墙、 ...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展
苹果AI主管透露自动驾驶汽车项目关于机器学习方面的进展

[2017-12-11]  苹果隐秘的自动驾驶汽车项目多年来一直在转移焦点,但今年似乎正在加速。 4月份,公司获得了在加利福尼亚州进行自动驾驶汽车测试的许可证,而在6月份,苹果公司首席执行官库......

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

本周栏目热点

让机器人参与救灾 需要克服哪些问题?

[1970-01-01]     灾害响应机器人要面对复杂的问题  大约是三四个月之前,在美国加利福尼亚 ...

五分钟让你洞晓海底机器人检测海管的玄机

[2016-02-01]     在2015年海洋技术大会(OTC)上,Oceaneering公司的Magna水下检测系统获得 ...

机器人治疗糖尿病

[1970-01-01]    众所周知,糖果、蛋糕巧克力等甜食是女生的最爱,今年22岁的姑娘小刘也是这些甜食的超级粉丝,每天都吃。她身高1米6,体重却有90多公斤 ...

[2015-12-14]     12月12日,由中科院沈阳自动化研究所、中国北方车辆研究所等9家单位发起的&mdash&mdash中关村融智特种 机器人 联盟首届理事会在京召开。来自科技 ...

服务机器人产业已奏起“狂想曲”

[1970-01-01]    服务机器人是机器人家族中的一个年轻成员,可以分为专业领域服务机器人和个人 家庭服务机器人,服务机器人的应用范围很广,主要从事维 ...