爱吧机器人网 » 技术 > 神经网络 > 正文

MIT用深度学习处理3D点云数据 应用于无人汽车等领域

如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。

\

\

这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。通过发射红外脉冲并测量其从物体反弹回来所用的时间,传感器创建出一个点云(point cloud),形成一个关于汽车周围环境的3D快照。

把未经处理的点云数据变得有实际意义并不容易,在机器学习时代以前,往往需要训练有素的工程师通过手工进行枯燥地详列他们想捕捉的特点。但来自MIT计算机科学与人工智能实验室(CSAIL)研究者们的一系列新论文显示,他们可以用深度学习自动化处理广泛的3D成像应用中的点云数据。

“今天的计算机视觉和机器学习中,90%的进展只处理二维图像,”MIT的Justin Solomon教授如是说,他是这一系列由博士生Yue Wang带头的论文的通讯作者。“我们的目标是解决‘更好地表征3D世界’这个基本需求,其应用不仅仅是在自动驾驶,而是任何需要理解3D形状的领域。”

需要从空间里大量的3D点中获得有意义的信息,先前大多数从数据中提取特征的方式都不是特别成功。在该研究团队的论文中,他们展现了新的分析点云的“EdgeConv”方式,即通过动态图卷积神经网络(dynamic graph convolutional neural network)来分类和分割独立物体。

\

“通过建立邻近点的图,算法可以捕获层次模式( hierarchical patterns )并因此推理出不同类型的通用信息用于各种下游任务。”Toyota Research Institute的机器学习科学家Wadim Kehl说道。

除了开发“ EdgeConv ”,团队还探索了点云处理的其他特殊方面。比如,其中一个挑战就是大多数传感器当它们在3D世界中转悠的时候总是改变角度;每次我们对一个物体重新扫描,它的位置可能与上一次我们看见它的时候不同。把多种点云融合到一个唯一的世界视角,你需要在一个叫做“ registration ”的进程中对齐或校准各种3D点。

从卫星数据到医疗手术,“registration”对于许多成像形式都至关重要。例如,当医生需要对病人进行多次磁共振成像扫描时,“registration”使扫描结果能够校准以找出变化。

“‘registration’是让我们能够将不同来源的三维数据集成到一个共同的坐标系中,”Yue Wang说,“没有它,我们实际上就无法从所有这些已开发的方法中获得有意义的信息。”

Solomon和Wang的第二篇论文展示了一种称为“ Deep Closest Point ”(DCP)的新 registration 算法,该算法能够更好地找到点云的识别模式、点和边(称为“ local features ”),以便将其与其他点云对齐。这对于自动驾驶汽车在场景中定位(“ localization ”)以及机器人手定位和抓取单个物体等任务尤其重要。

DCP的一个局限是,它假设我们可以看到一个完整的形状,而不仅仅是一侧。这意味着它无法处理更困难对齐形状的部分视角( partial-to-partial registration)的任务。因此,在第三篇论文中,研究人员提出了一种改进的算法,称之为 Partial Registration Network (PRNet) 。

Solomon说,与2D图像和照片相比,现有的3D数据往往不结构化和难以处理。他的团队试图找出如何在没有很多机器学习技术所需的可控环境下,从所有无序的3D数据中获得有意义的信息。

DCP和PRNet成功背后的一个关键观察是,点云处理的一个重要方面是背景。点云A上的几何特征暗示了将其与点云B对齐的最佳方式,这可能与将其与点云C对齐所需的特征不同。例如,在 partial registration 中,一个点云中形状的有趣部分可能在另一个点云中不可见,这使其对registration无效。

Wang 说,该团队的工具已经被计算机视觉社区和其他领域的许多研究人员使用。甚至物理学家也在使用它们来实现csail团队从未考虑过的应用:粒子物理学。

接下来,研究人员希望在真实世界的数据上使用这些算法,包括从自动驾驶汽车上收集的数据。Wang 说,他们还计划探索利用自我监督学习训练系统的潜力,以尽量减少所需的人类注释。

Solomon和Wang是DCP和PRNET论文的两位唯一作者。他们在 EdgeConv 论文上的共同作者是研究助理 Yongbin Sun 和麻省理工学院的 Sanjay Sarma 教授,以及加州大学伯克利分校的 Ziwei Liu 博士后和伦敦帝国理工学院的 Michael M. Bronstein 。

这些项目在一定程度上得到了美国空军、美国陆军研究办公室、亚马逊、谷歌研究公司、IBM、国家科学基金会、斯科尔特理工学院Next Generation项目和丰田研究所的支持。

——end——

爱吧机器人网原创



上一篇:可编辑神经网络,有望简化深度学习?
下一篇:深度神经网络揭示了大脑喜欢看什么
精选推荐
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

英国首台月球车是个小型四腿机器人 将于2021年登月
英国首台月球车是个小型四腿机器人 将于2021年登月

[2019-10-12]  探测器将用四条腿探测月球表面,并将数据传回着陆器,后者将把数据传回地球图 詹姆斯温斯皮尔英国即将成为继美国、俄罗斯、中国之后的又一 ...

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

本周栏目热点

[2016-11-20]      神经网络 是一种运算模型,由大量的节点(或称神经元)和之间相互连接构成。每个节点代表一种特定的输出函数,称为激励函数(Activ ...

[2016-11-20]   优化问题是工业设计中经常遇到的问题,许多问题最后都可以归结为优化问题 为了解决各种各样的优化问题,人们提出了许多优 ...

深度神经网络会产生人这样的智能吗?

[2016-11-20]   深度学习在近年的进展又一次点燃了各界对人工 神经网络 的热情。这一技术在图像识别、 语音识别 、棋类游戏等领域的成效出人意料,而且 ...

[2016-11-20]   遗传 算法 优化BP 神经网络 权值和阈值的通用MATLAB 源码 遗传 算法 优化 神经网络 有两种情况,一种是把训练好的 神经网络 作为黑 ...

OpenAI开辟全新AI音乐领域,发布Jukebox神经网络生产歌曲

[2020-05-19]  日前,外媒报道,人工智能(AI)技术生成的音乐会给人们带来非常奇妙体验。其中有两大原因,第一,这是一个非常吸引人的全新领域;第二,这 ...