爱吧机器人网 » 技术 > 神经网络 > 正文

技术前沿|图像去雨滴算法

技术前沿 
作者:萝卜兔

在图像处理的过程中,会遇到各种各样的噪声,比如在夜晚场景下的照片会有很多噪点,在雾霾天气下会朦胧不清,在下雨天会有密密麻麻的雨滴.....所以去除图像中的各种噪声,还原清晰的图像也是CV领域的一大研究方向。萝卜兔今天便给大家介绍一些前沿的图像去雨滴算法。

用注意力对抗网络进行单图去雨

该方法是来自于今年的CVPR文章《Attentive Generative Adversarial Network for Raindrop Removal from a Single Image》,是北京大学、新加坡国立大学以及耶鲁-新加坡国大的研究成果,主要是对车窗上的水滴进行清除。

由于受各方面因素的影响,去雨问题实际是一个很复杂的问题,首先这个问题是如何建模,基本的思想是将带雨图像分解为不带雨滴的图像和受雨滴影响的图像。
其中I是就是我们需要处理的带雨滴图像,M是一个0,1掩膜,  B是不带雨滴的真实背景图,R是受雨滴影响的图像。去雨的目标就是要从I中恢复出B。


这篇文章使用GAN框架来解决这个问题,创新的地方在于在生成器和判别器中引入了视觉注意力机制,让模型能够意识到哪些地方是受雨影响的,整个框架如下图,下面来看看两部分具体是如何工作的。


生成器

生成器包括两部分,一个是基于循环神经网络生成注意力热图,另一部分是上下文自编码器,用于生成去雨之后的图像。

首先来看如何生成注意力热图,作者使用了循环神经网络的结构,每个cell包括使用5层ResNet提取特征,然后送入convLSTM中生成2D的注意力热图。每一个step都使用上一时刻的注意力热图和原图作为输入,逐渐生成更精确的注意力分配图。这一部分使用掩膜M作为每个step的监督,指导注意力热图的生成。

接下来看如何生成去雨的图像。这一部分的有两个目标,一是要生成去雨的图像,而是要保证生成的图像尽可能真实。图像生成的主要框架是一个自编码器,输入是带雨图像与注意力热图,输出是去雨的图像。在损失函数上两部分Lm和Lp, Lm是一个多尺度的Loss,它是为了在解码的时候保证获得更多的上下文提升生成的图像质量,具体来讲就是讲真实的背景图像进行下采样分别用于监督解码器不同的层级,具体形式都是基于像素的MSE;Lp称为感知Loss(perceptual loss),它利用VGG16提取高层的特征进行监督来保证生成图像的质量。

判别器

判别器是为了区分出谁是真的谁是假的,对图像进行判别,可以从全局和局部两个方面进行,从局部来看就是要检查可能为假的部分,可是并没有先验的信息来告诉我们哪些位置可能为假,因此需要判别器自己去学。文章为了解决这个问题,将上一步中生成的注意力热图引入到判别器中。具体来讲,在判别器CNN的中间部分生成一个注意力分配图,将其与特征相乘之后传入下一层,注意力分配的监督工作由生成器得到的注意力热图完成,这样相当于引导判别器主要关注受雨滴影响部分的真实性。

实验效果
实现细节参照论文:
https://arxiv.org/pdf/1711.10098.pdf

RESCAN单图去雨

该论文是来自北京大学和上海交通大学的几位研究者的成果,已经入选今年的ECCV会议,他们在卷积神经网络以及循环神经网络的基础上,提出了一种新的神经网络架构RESCSN来处理单图雨滴。

这篇文章对于去雨问题的建模也是将问题进行分解,稍有不同的是将雨的影响进行了细分,认为R是由多种雨的纹路(rain streaks)组成的。另外在模型的建模目标上也有不同,上一篇文章直接去生成去雨的图像,而本文则希望去建模得到R,这样B = O - R。因此这篇文章的总体目标就是希望学到一个映射F, 使得F(O) 与 R尽可能接近。

方法

文章提出了一种称为REcurrent SE Context Aggregation Net (RESCAN)的框架,整个过程是多阶段的,逐步得到R。

每个阶段使用一种称为SCAN的结构,这个结构主要有以下几个特点:
第一是使用空洞卷积快速扩大感知野,因为在去雨中更多的上下文信息是比较关键的,比如上篇文章的多尺度的Loss;
第二个特点是使用SE模块(具体可以参考论文1),作者认为特征图的每个channel都可以看为某种Ri的表示(embedding),每个Ri都有一个对应的系数αi,通过引入SE模块,可以显式地为不同Ri赋值不同的系数。这样每个阶段都能得到某些rain streaks,也就是说每个阶段都能去除某些rain streaks。

由于一个阶段不可能将所有的rain streaks都去除,因此需要多阶段逐步地进行,这个过程通过RNN的结构来建模。
实验效果



具体技术细节参考论文:
https://arxiv.org/pdf/1807.05698.pdf

去除图像中的雨滴也有很多可以应用的地方,比如说如果自动驾驶,如果车辆要在雨天行驶的话,就需要保持良好干净的视野,再比如处理下雨天道路的监控图像以及一些需要在雨中作业的机器。虽然,这只是CV领域的一个小小细枝节,但也是可以造福我们人类的重要科技力量。

参考文献:
1. Hu, J., Shen, L., Sun, G.: Squeeze-and-excitation networks. arXiv preprint arXiv:1709.01507 (2017)
2. Qian, Rui, et al. "Attentive generative adversarial network for raindrop removal from a single image." arXiv preprint arXiv:1711.10098 (2017).
3. Li, Xia, et al. "Recurrent Squeeze-and-Excitation Context Aggregation Net for Single Image Deraining." arXiv preprint arXiv:1807.05698(2018).



上一篇:计算机视觉领域前沿一览
下一篇:AutoMl及NAS概述:更有效地设计神经网络模型工具
精选推荐
这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作
瑞士研发出微型机器人集群 可像蚂蚁一样互相交流并协同工作

[2019-07-12]  EPFL(瑞士联邦理工学院)的研究人员受到了蚂蚁的启发,开发了一款仅有10克重的小型机器人:他们可以相互交流,分配角色并完成复杂的任务。 ...

集群机器人领域最新研究:一种用于探测未知环境的微型无人机群
集群机器人领域最新研究:一种用于探测未知环境的微型无人机群

[2019-10-26]  (图:无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向,它将试图飞到另一个方向。若首选方向冲突,低优先 ...

MIT用深度学习处理3D点云数据 应用于无人汽车等领域
MIT用深度学习处理3D点云数据 应用于无人汽车等领域

[2019-10-23]  如果你见过自动驾驶汽车,也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器,无人驾驶汽车依靠它在现实世界中进行导航。 ...

Waymo:人性和行为心理学才是无人驾驶最大的挑战
Waymo:人性和行为心理学才是无人驾驶最大的挑战

[2019-11-03]  自动驾驶汽车作为AI领域内最大的挑战之一,谷歌致力于其研发已有十余载,现在他们逐渐意识到,最困难的是如何让人们享受驾驶的乐趣。这是一 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算
谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23]  谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月,虽然遭到竞争对手的质疑,但就 ...

麻省理工正研究植物机器人 让植物自主控制机器人
麻省理工正研究植物机器人 让植物自主控制机器人

[2018-12-08]  控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人,但我们很少听说植物机器人对吧?一个机器人其实是对植物有很大益处的,因为一般植物根本无法移动......

本周栏目热点

[2016-11-20]      神经网络 是一种运算模型,由大量的节点(或称神经元)和之间相互连接构成。每个节点代表一种特定的输出函数,称为激励函数(Activ ...

[2016-11-20]   优化问题是工业设计中经常遇到的问题,许多问题最后都可以归结为优化问题 为了解决各种各样的优化问题,人们提出了许多优 ...

深度神经网络会产生人这样的智能吗?

[2016-11-20]   深度学习在近年的进展又一次点燃了各界对人工 神经网络 的热情。这一技术在图像识别、 语音识别 、棋类游戏等领域的成效出人意料,而且 ...

[2016-11-20]   遗传 算法 优化BP 神经网络 权值和阈值的通用MATLAB 源码 遗传 算法 优化 神经网络 有两种情况,一种是把训练好的 神经网络 作为黑 ...

OpenAI开辟全新AI音乐领域,发布Jukebox神经网络生产歌曲

[2020-05-19]  日前,外媒报道,人工智能(AI)技术生成的音乐会给人们带来非常奇妙体验。其中有两大原因,第一,这是一个非常吸引人的全新领域;第二,这 ...