爱吧机器人网 » 技术 > 机器人学 > 正文

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准
这个世界上没有任何东西能够非常接近人手的敏捷性和灵活性,无论是动物还是机器人。对于埃隆·马斯克创立的非营利组织OpenAI的工程师来说,这既是挑战也是机遇。它们的研究人员如何使用人工智能来教导机器人像人一样巧妙地操纵物体?

通常,在教授AI来控制物理机器人时,科学家们往往会遇到同样的问题。培训通常使用强化学习来完成;AI通过反复试错的学习方法。但这需要很多时间,几乎相当于多年的经验。如果你想让AI打赢一场电子游戏,很简单,你只需要让它以更快的速度玩游戏。但如果你想教它一个真实的任务,那就麻烦了。你无法等待机器人手臂经历多年的练习,并且很难足够准确地出于训练目的模拟世界。

对于OpenAI,它们自己设定的任务是教一个机器人用手来操纵一个六面立方体;将这个立方体从一个位置移动到另一个位置,使特定的一面朝上。与早期的研究一样,首先尽可能准确地模拟这种环境,但下一步却产生差异:开始弄乱模拟。

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准图片来源:OpenAI

首先,添加了随机视觉噪音;然后,改变了虚拟手和立方体的颜色。它们随机化了立方体的大小;表面有多滑;有多重。它们甚至弄乱了模拟的重力。所有这一切的效果是让AI更好地理解在现实世界中操纵立方体的可能性。虽然模拟可能不是完全真实的,但它有足够多的变化,允许系统学习处理意外。

参与该项目的OpenAI的Matthias Plappert解释说,改变模拟的重力是一个特别有趣的变量。该团队知道,当AI系统(称为Dactyl)正在控制真正的机器人手时,手的基部每次可能不会以相同的角度定位。较低的角度意味着立方体会更容易从手中掉落。为了教Dactyl如何处理这种变体,他们决定将模拟中的重力随机化。 “没有这种随机化,它就会一直弄丢物体,因为不习惯。”Plappert说。

通过所有这些随机化需要很长时间。很长一段时间。事实上,Dactyl必须积累大约100年的经验才能达到最佳表现。反过来,这意味着团队必须使用大量的计算能力 —— 大约6,144个CPU和8个非常强大的英伟达 V100 GPU。这种硬件只有极少数研究机构才能使用。

但Plappert说,最终的结果是值得的。完成训练后,Dactyl能够将立方体从一个位置移动到另一个位置,连续50次,而不会掉落。 (虽然它这样做的中位数要小得多;只有13次。)在学习移动立方体的过程中,Dactyl甚至开发了类似人类的行为。所有这些都是在没有任何人为指导的情况下学到的 —— 只是反复试错,几十年一次。

“这表明我们人类为操纵所做的事情是非常优化的。”Plappert说。 “当你看到一个试图解决问题的机器人时,这是一个非常有趣的时刻,你会想‘噢,嘿,我也会这样做。’”

OpenAI利用人工智能教机器人操纵物体 为灵活性设定新基准图片来源:OpenAI

机器人技术和人工智能领域的专家对The Verge高度赞扬了OpenAI的工作,但警告说它并不代表机器人操纵有了突破。卡内基梅隆大学机器人研究所的Smruti Amarjyoti指出,随机化系统训练环境的想法之前已经完成,但是说Dactyl的动作是“优雅的”,他认为对AI来说是不可能的。

“最终的结果非常复杂和精细。”Amarjyoti说,“[但]我认为OpenAI在这一领域的最大成就将是,它所采用的工程协调以及用于实现这一壮举的计算能力。”

Istituto Italiano di Tecnologia的机器人学教授安东尼奥·比奇(Antonio Bicchi)表示,这项研究“优雅且令人着迷”,但指出了一些局限性。 “结果仍然局限于在相当有利的条件下(手正面朝上,所以骰子落在掌中)进行的一个特定任务(滚动一个大小合适的模具),对于这些技术能解决现实世界的机器人问题,甚至不是一个确凿的论据。”比奇说。

对于OpenAI来说,这项研究大体上是令人满意的。该系统使用了许多与实验室开发的相同算法和技术,来教授其电子游戏机器人OpenAI Five。该公司建议,这表明它正在构建通用算法,可以用来处理各种各样的任务,对于雄心勃勃的AI实验室和公司来说,这是一个里程碑。

在人工智能的帮助下创建更灵巧的机器人,对于尝试自动化手工劳动的公司来说,将是一个巨大的福音,并且有许多初创公司积极地在该领域进行研究。 但是,提高机器人技术的先进水平肯定会让更多的工作岗位自动化,而这种工作破坏浪潮是否可以被新技术创造的工作所抵消,这是一个悬而未决的问题。

不管怎样,很明显,人工智能还有一段路要走,才能与人类的运动技能相匹配。但毫无疑问,机器正在迎头赶上,比以往任何时候都要快。


上一篇:机械臂还能这样玩?Touch & Melt:抽象触觉和机器人热成型
下一篇:机器人也可以有触觉?这个神经网络让假肢都能有反射丨Science
精选推荐
MIT最新“人机”互连系统 让双腿机器人复制人体技能
MIT最新“人机”互连系统 让双腿机器人复制人体技能

[2019-11-01]  MIT的小爱马仕想借用你的大脑 ,图片来自: João Ramos爱吧机器人网消息,麻省理工学院(MIT)的研究人员展示了一种新型遥操作系 ...

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

本周栏目热点

全面了解机器人的精度

[2018-05-07]  1 绝对精度是啥玩意? 这个软件能否后刷进机器人系统?关于第二个问题,近期有不少客户询问本助手,这个软件可以后刷到系统里卖面吗?可以 ...

机器人离线编程误差来源分析及消除办法

[2018-01-02]  随着机器人应用领域越来越广,传统的示教编程这种编程手段有些场合变得效率非常低下,于是离线编程应运而生,并且应用越来越普及。初用离线编程的朋友,总会被最后生...

工业机器人常用气缸的内部结构和工作原理

[2017-12-21]  气缸的组成 : 缸体,活塞,密封圈,磁环(有传感器的气缸)。原理 : 压力空气使活塞移动,通过改变进气方向,改变活塞杆的移动方向。失效形式 : 活塞卡死,不动作;气缸......

一文读懂机器人传感器的秘密

[2017-12-20]  机器人也是通过感知系统来感知世界,这个感知系统是通过各种各样的传感器组成的。传感器可以感受外界的信号,如光、热、烟雾、压力和湿度等等,并将信息传递给下一级装置,机......

远程机器人技术旨在帮助外科医生减少手术过程中的意外伤害

[2020-05-02]  据外媒New Atlas报道,远程机器人系统已经允许外科医生在一个地方控制另一个地方的机器人手术工具,因此他们可以在远处进行手术。然而,一 ...