爱吧机器人网 » 技术 > 机器人学 > 正文

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准
这个世界上没有任何东西能够非常接近人手的敏捷性和灵活性,无论是动物还是机器人。对于埃隆·马斯克创立的非营利组织OpenAI的工程师来说,这既是挑战也是机遇。它们的研究人员如何使用人工智能来教导机器人像人一样巧妙地操纵物体?

通常,在教授AI来控制物理机器人时,科学家们往往会遇到同样的问题。培训通常使用强化学习来完成;AI通过反复试错的学习方法。但这需要很多时间,几乎相当于多年的经验。如果你想让AI打赢一场电子游戏,很简单,你只需要让它以更快的速度玩游戏。但如果你想教它一个真实的任务,那就麻烦了。你无法等待机器人手臂经历多年的练习,并且很难足够准确地出于训练目的模拟世界。

对于OpenAI,它们自己设定的任务是教一个机器人用手来操纵一个六面立方体;将这个立方体从一个位置移动到另一个位置,使特定的一面朝上。与早期的研究一样,首先尽可能准确地模拟这种环境,但下一步却产生差异:开始弄乱模拟。

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准图片来源:OpenAI

首先,添加了随机视觉噪音;然后,改变了虚拟手和立方体的颜色。它们随机化了立方体的大小;表面有多滑;有多重。它们甚至弄乱了模拟的重力。所有这一切的效果是让AI更好地理解在现实世界中操纵立方体的可能性。虽然模拟可能不是完全真实的,但它有足够多的变化,允许系统学习处理意外。

参与该项目的OpenAI的Matthias Plappert解释说,改变模拟的重力是一个特别有趣的变量。该团队知道,当AI系统(称为Dactyl)正在控制真正的机器人手时,手的基部每次可能不会以相同的角度定位。较低的角度意味着立方体会更容易从手中掉落。为了教Dactyl如何处理这种变体,他们决定将模拟中的重力随机化。 “没有这种随机化,它就会一直弄丢物体,因为不习惯。”Plappert说。

通过所有这些随机化需要很长时间。很长一段时间。事实上,Dactyl必须积累大约100年的经验才能达到最佳表现。反过来,这意味着团队必须使用大量的计算能力 —— 大约6,144个CPU和8个非常强大的英伟达 V100 GPU。这种硬件只有极少数研究机构才能使用。

但Plappert说,最终的结果是值得的。完成训练后,Dactyl能够将立方体从一个位置移动到另一个位置,连续50次,而不会掉落。 (虽然它这样做的中位数要小得多;只有13次。)在学习移动立方体的过程中,Dactyl甚至开发了类似人类的行为。所有这些都是在没有任何人为指导的情况下学到的 —— 只是反复试错,几十年一次。

“这表明我们人类为操纵所做的事情是非常优化的。”Plappert说。 “当你看到一个试图解决问题的机器人时,这是一个非常有趣的时刻,你会想‘噢,嘿,我也会这样做。’”

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准图片来源:OpenAI

机器人技术和人工智能领域的专家对The Verge高度赞扬了OpenAI的工作,但警告说它并不代表机器人操纵有了突破。卡内基梅隆大学机器人研究所的Smruti Amarjyoti指出,随机化系统训练环境的想法之前已经完成,但是说Dactyl的动作是“优雅的”,他认为对AI来说是不可能的。

“最终的结果非常复杂和精细。”Amarjyoti说,“[但]我认为OpenAI在这一领域的最大成就将是,它所采用的工程协调以及用于实现这一壮举的计算能力。”

Istituto Italiano di Tecnologia的机器人学教授安东尼奥·比奇(Antonio Bicchi)表示,这项研究“优雅且令人着迷”,但指出了一些局限性。 “结果仍然局限于在相当有利的条件下(手正面朝上,所以骰子落在掌中)进行的一个特定任务(滚动一个大小合适的模具),对于这些技术能解决现实世界的机器人问题,甚至不是一个确凿的论据。”比奇说。

对于OpenAI来说,这项研究大体上是令人满意的。该系统使用了许多与实验室开发的相同算法和技术,来教授其电子游戏机器人OpenAI Five。该公司建议,这表明它正在构建通用算法,可以用来处理各种各样的任务,对于雄心勃勃的AI实验室和公司来说,这是一个里程碑。

在人工智能的帮助下创建更灵巧的机器人,对于尝试自动化手工劳动的公司来说,将是一个巨大的福音,并且有许多初创公司积极地在该领域进行研究。 但是,提高机器人技术的先进水平肯定会让更多的工作岗位自动化,而这种工作破坏浪潮是否可以被新技术创造的工作所抵消,这是一个悬而未决的问题。

不管怎样,很明显,人工智能还有一段路要走,才能与人类的运动技能相匹配。但毫无疑问,机器正在迎头赶上,比以往任何时候都要快。


上一篇:机械臂还能这样玩?Touch & Melt:抽象触觉和机器人热成型
下一篇:机器人也可以有触觉?这个神经网络让假肢都能有反射丨Science
精选推荐
麻省理工最新机器人“装配工”未来可建造太空基地
麻省理工最新机器人“装配工”未来可建造太空基地

[2019-10-17]  两个机器人原型把一系列小单元组装成大结构体麻省理工学院科研人员最近提出一种新型机器人技术,即一种小型机器人系统,能够自主地用统一规 ...

美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食
美国普渡大学研发快动作软体机器人,灵感来自变色龙舌头捕食

[2019-10-31]  本文图片均来自:Ramses v Martinez 普渡大学变色龙、蝾螈和许多蟾蜍利用积蓄的弹性能量,向距离1 5倍体长的毫无防备的昆虫伸出粘糊糊的舌 ...

改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来使消费者受益
改变保险市场的格局:无人机如何通过更快的估算、响应时间和利益交付来

[2018-12-08]  市场研究公司IHS Markit预测,到2020年,专业无人机市场将通过农业,能源和建筑等行业利用测量,制图,规划等技术实现77 1%的复合年增长率(CAGR)。与此同时,消费者无人......

亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)
亚马逊CEO杰夫·贝佐斯操控巨型有人驾驶机器人(巨型机甲)

[2017-03-21]  近日,亚马逊CEO杰夫·贝佐斯实现了每一个6岁儿童都会有的梦想,他控制了一个巨大的机甲机器人。据国外媒体Verge报道,前天(3月19日),贝 ...

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

亚马逊计划建一个4000万美元的机器人中心
亚马逊计划建一个4000万美元的机器人中心

[2019-11-07]  爱吧机器人网消息,亚马逊11月6日宣布了一项计划,计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

美国喷气推进实验室的AI驱动无人机挑战人类飞行员
美国喷气推进实验室的AI驱动无人机挑战人类飞行员

[2017-12-08]  随着无人机及其组件越来越小,效率越来越高,功能越来越强大,我们已经看到越来越多的研究开始让无人机自主飞行在半结构化的环境中,而不依赖于外部定位。 宾夕法尼亚大学在......

本周栏目热点

麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

机器人离线编程误差来源分析及消除办法

[2018-01-02]  随着机器人应用领域越来越广,传统的示教编程这种编程手段有些场合变得效率非常低下,于是离线编程应运而生,并且应用越来越普及。初用离线编程的朋友,总会被最后生...

全面了解机器人的精度

[2018-05-07]  1 绝对精度是啥玩意? 这个软件能否后刷进机器人系统?关于第二个问题,近期有不少客户询问本助手,这个软件可以后刷到系统里卖面吗?可以 ...

使用Azure Bot创建一个智能聊天机器人|附源代码

[2018-01-09]  首先,需要在Azure门户上创建一个帐户。只有这样,我们才能在云环境中托管应用程序。在左侧菜单上单击New,它将打开Azure Marketplace,在那里我们可以看到服务列表。点击AI +认知服务...

未来10年机器人技术面临这十大挑战

[2018-02-09]  近年来,机器人研究取得了长足的进步,但要想在我们的生活中普及机器人仍是障碍重重。《Science Robotics》杂志列举了机器人普及亟待解决 ...