爱吧机器人网 » 技术 > 神经网络 > 正文

MIT用深度学习处理3D点云数据 应用于无人汽车等领域

如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。

\

\

这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。通过发射红外脉冲并测量其从物体反弹回来所用的时间,传感器创建出一个点云(point cloud),形成一个关于汽车周围环境的3D快照。

把未经处理的点云数据变得有实际意义并不容易,在机器学习时代以前,往往需要训练有素的工程师通过手工进行枯燥地详列他们想捕捉的特点。但来自MIT计算机科学与人工智能实验室(CSAIL)研究者们的一系列新论文显示,他们可以用深度学习自动化处理广泛的3D成像应用中的点云数据。

“今天的计算机视觉和机器学习中,90%的进展只处理二维图像,”MIT的Justin Solomon教授如是说,他是这一系列由博士生Yue Wang带头的论文的通讯作者。“我们的目标是解决‘更好地表征3D世界’这个基本需求,其应用不仅仅是在自动驾驶,而是任何需要理解3D形状的领域。”

需要从空间里大量的3D点中获得有意义的信息,先前大多数从数据中提取特征的方式都不是特别成功。在该研究团队的论文中,他们展现了新的分析点云的“EdgeConv”方式,即通过动态图卷积神经网络(dynamic graph convolutional neural network)来分类和分割独立物体。

\

“通过建立邻近点的图,算法可以捕获层次模式( hierarchical patterns )并因此推理出不同类型的通用信息用于各种下游任务。”Toyota Research Institute的机器学习科学家Wadim Kehl说道。

除了开发“ EdgeConv ”,团队还探索了点云处理的其他特殊方面。比如,其中一个挑战就是大多数传感器当它们在3D世界中转悠的时候总是改变角度;每次我们对一个物体重新扫描,它的位置可能与上一次我们看见它的时候不同。把多种点云融合到一个唯一的世界视角,你需要在一个叫做“ registration ”的进程中对齐或校准各种3D点。

从卫星数据到医疗手术,“registration”对于许多成像形式都至关重要。例如,当医生需要对病人进行多次磁共振成像扫描时,“registration”使扫描结果能够校准以找出变化。

“‘registration’是让我们能够将不同来源的三维数据集成到一个共同的坐标系中,”Yue Wang说,“没有它,我们实际上就无法从所有这些已开发的方法中获得有意义的信息。”

Solomon和Wang的第二篇论文展示了一种称为“ Deep Closest Point ”(DCP)的新 registration 算法,该算法能够更好地找到点云的识别模式、点和边(称为“ local features ”),以便将其与其他点云对齐。这对于自动驾驶汽车在场景中定位(“ localization ”)以及机器人手定位和抓取单个物体等任务尤其重要。

DCP的一个局限是,它假设我们可以看到一个完整的形状,而不仅仅是一侧。这意味着它无法处理更困难对齐形状的部分视角( partial-to-partial registration)的任务。因此,在第三篇论文中,研究人员提出了一种改进的算法,称之为 Partial Registration Network (PRNet) 。

Solomon说,与2D图像和照片相比,现有的3D数据往往不结构化和难以处理。他的团队试图找出如何在没有很多机器学习技术所需的可控环境下,从所有无序的3D数据中获得有意义的信息。

DCP和PRNet成功背后的一个关键观察是,点云处理的一个重要方面是背景。点云A上的几何特征暗示了将其与点云B对齐的最佳方式,这可能与将其与点云C对齐所需的特征不同。例如,在 partial registration 中,一个点云中形状的有趣部分可能在另一个点云中不可见,这使其对registration无效。

Wang 说,该团队的工具已经被计算机视觉社区和其他领域的许多研究人员使用。甚至物理学家也在使用它们来实现csail团队从未考虑过的应用:粒子物理学。

接下来,研究人员希望在真实世界的数据上使用这些算法,包括从自动驾驶汽车上收集的数据。Wang 说,他们还计划探索利用自我监督学习训练系统的潜力,以尽量减少所需的人类注释。

Solomon和Wang是DCP和PRNET论文的两位唯一作者。他们在 EdgeConv 论文上的共同作者是研究助理 Yongbin Sun 和麻省理工学院的 Sanjay Sarma 教授,以及加州大学伯克利分校的 Ziwei Liu 博士后和伦敦帝国理工学院的 Michael M. Bronstein 。

这些项目在一定程度上得到了美国空军、美国陆军研究办公室、亚马逊、谷歌研究公司、IBM、国家科学基金会、斯科尔特理工学院Next Generation项目和丰田研究所的支持。

——end——

爱吧机器人网原创



上一篇:可编辑神经网络,有望简化深度学习?
下一篇:深度神经网络揭示了大脑喜欢看什么
精选推荐
麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图
谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

[2019-10-26]  谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT ...

谷歌在中国成立一个新的人工智能(AI)研究中心
谷歌在中国成立一个新的人工智能(AI)研究中心

[2017-12-13]  谷歌正在中国建立一个新的人工智能(AI)研究中心,希望进一步扩展到中国,以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一,亚马逊,微软......

人工神经网络技术解码人类行为和想象时的大脑活动信号
人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23]  为搜索引擎过滤信息,棋盘游戏对弈,识别图像 人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

本周栏目热点

神经网络:人工智能以及我们的未来

[2016-11-20]   作者:James Crowder翻译:王益军审校:心原文链接:techcrunch把自己想象成在一辆未来的自动驾驶汽车的乘客。这辆汽车与你以一种 ...

[2016-11-20]   include "stdio h" include "stdlib h" include "time h" include "math h" *********************************************i ...

OpenAI开辟全新AI音乐领域,发布Jukebox神经网络生产歌曲

[2020-05-19]  日前,外媒报道,人工智能(AI)技术生成的音乐会给人们带来非常奇妙体验。其中有两大原因,第一,这是一个非常吸引人的全新领域;第二,这 ...

50行代码玩转生成对抗网络GAN模型!(附源码)

[2018-07-30]  本文为大家介绍了生成对抗网络(Generate Adversarial Network,GAN),以最直白的语言来讲解它,最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...