爱吧机器人网 » 技术 > 神经网络 > 正文

技术前沿|图像去雨滴算法

技术前沿 
作者:萝卜兔

在图像处理的过程中,会遇到各种各样的噪声,比如在夜晚场景下的照片会有很多噪点,在雾霾天气下会朦胧不清,在下雨天会有密密麻麻的雨滴.....所以去除图像中的各种噪声,还原清晰的图像也是CV领域的一大研究方向。萝卜兔今天便给大家介绍一些前沿的图像去雨滴算法。

用注意力对抗网络进行单图去雨

该方法是来自于今年的CVPR文章《Attentive Generative Adversarial Network for Raindrop Removal from a Single Image》,是北京大学、新加坡国立大学以及耶鲁-新加坡国大的研究成果,主要是对车窗上的水滴进行清除。

由于受各方面因素的影响,去雨问题实际是一个很复杂的问题,首先这个问题是如何建模,基本的思想是将带雨图像分解为不带雨滴的图像和受雨滴影响的图像。
其中I是就是我们需要处理的带雨滴图像,M是一个0,1掩膜,  B是不带雨滴的真实背景图,R是受雨滴影响的图像。去雨的目标就是要从I中恢复出B。


这篇文章使用GAN框架来解决这个问题,创新的地方在于在生成器和判别器中引入了视觉注意力机制,让模型能够意识到哪些地方是受雨影响的,整个框架如下图,下面来看看两部分具体是如何工作的。


生成器

生成器包括两部分,一个是基于循环神经网络生成注意力热图,另一部分是上下文自编码器,用于生成去雨之后的图像。

首先来看如何生成注意力热图,作者使用了循环神经网络的结构,每个cell包括使用5层ResNet提取特征,然后送入convLSTM中生成2D的注意力热图。每一个step都使用上一时刻的注意力热图和原图作为输入,逐渐生成更精确的注意力分配图。这一部分使用掩膜M作为每个step的监督,指导注意力热图的生成。

接下来看如何生成去雨的图像。这一部分的有两个目标,一是要生成去雨的图像,而是要保证生成的图像尽可能真实。图像生成的主要框架是一个自编码器,输入是带雨图像与注意力热图,输出是去雨的图像。在损失函数上两部分Lm和Lp, Lm是一个多尺度的Loss,它是为了在解码的时候保证获得更多的上下文提升生成的图像质量,具体来讲就是讲真实的背景图像进行下采样分别用于监督解码器不同的层级,具体形式都是基于像素的MSE;Lp称为感知Loss(perceptual loss),它利用VGG16提取高层的特征进行监督来保证生成图像的质量。

判别器

判别器是为了区分出谁是真的谁是假的,对图像进行判别,可以从全局和局部两个方面进行,从局部来看就是要检查可能为假的部分,可是并没有先验的信息来告诉我们哪些位置可能为假,因此需要判别器自己去学。文章为了解决这个问题,将上一步中生成的注意力热图引入到判别器中。具体来讲,在判别器CNN的中间部分生成一个注意力分配图,将其与特征相乘之后传入下一层,注意力分配的监督工作由生成器得到的注意力热图完成,这样相当于引导判别器主要关注受雨滴影响部分的真实性。

实验效果
实现细节参照论文:
https://arxiv.org/pdf/1711.10098.pdf

RESCAN单图去雨

该论文是来自北京大学和上海交通大学的几位研究者的成果,已经入选今年的ECCV会议,他们在卷积神经网络以及循环神经网络的基础上,提出了一种新的神经网络架构RESCSN来处理单图雨滴。

这篇文章对于去雨问题的建模也是将问题进行分解,稍有不同的是将雨的影响进行了细分,认为R是由多种雨的纹路(rain streaks)组成的。另外在模型的建模目标上也有不同,上一篇文章直接去生成去雨的图像,而本文则希望去建模得到R,这样B = O - R。因此这篇文章的总体目标就是希望学到一个映射F, 使得F(O) 与 R尽可能接近。

方法

文章提出了一种称为REcurrent SE Context Aggregation Net (RESCAN)的框架,整个过程是多阶段的,逐步得到R。

每个阶段使用一种称为SCAN的结构,这个结构主要有以下几个特点:
第一是使用空洞卷积快速扩大感知野,因为在去雨中更多的上下文信息是比较关键的,比如上篇文章的多尺度的Loss;
第二个特点是使用SE模块(具体可以参考论文1),作者认为特征图的每个channel都可以看为某种Ri的表示(embedding),每个Ri都有一个对应的系数αi,通过引入SE模块,可以显式地为不同Ri赋值不同的系数。这样每个阶段都能得到某些rain streaks,也就是说每个阶段都能去除某些rain streaks。

由于一个阶段不可能将所有的rain streaks都去除,因此需要多阶段逐步地进行,这个过程通过RNN的结构来建模。
实验效果



具体技术细节参考论文:
https://arxiv.org/pdf/1807.05698.pdf

去除图像中的雨滴也有很多可以应用的地方,比如说如果自动驾驶,如果车辆要在雨天行驶的话,就需要保持良好干净的视野,再比如处理下雨天道路的监控图像以及一些需要在雨中作业的机器。虽然,这只是CV领域的一个小小细枝节,但也是可以造福我们人类的重要科技力量。

参考文献:
1. Hu, J., Shen, L., Sun, G.: Squeeze-and-excitation networks. arXiv preprint arXiv:1709.01507 (2017)
2. Qian, Rui, et al. "Attentive generative adversarial network for raindrop removal from a single image." arXiv preprint arXiv:1711.10098 (2017).
3. Li, Xia, et al. "Recurrent Squeeze-and-Excitation Context Aggregation Net for Single Image Deraining." arXiv preprint arXiv:1807.05698(2018).



上一篇:计算机视觉领域前沿一览
下一篇:AutoMl及NAS概述:更有效地设计神经网络模型工具
精选推荐
比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

受大脑控制的机器人
受大脑控制的机器人

[2017-03-21]   想让机器人做我们想做的,首先,他得全面地了解我们。通常,这就意味着人类需要要付出更多。比如,教机器人复杂的人类语言或者把一项任务 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

为未来战场创造更有效的机器人 美国陆军研究人工纳米马达
为未来战场创造更有效的机器人 美国陆军研究人工纳米马达

[2019-10-11]  为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友,美国陆军研究人员正在执行一项任务,即研究肌肉分子生命功能的价值,以及复制过 ...

从AI中窥探人性
从AI中窥探人性

[2018-01-03]  人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在,一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

智能农业:种地的事儿未来全交给这些机器人吧
智能农业:种地的事儿未来全交给这些机器人吧

[2019-12-07]  SRC公司创始人Sam与温波尔庄园农场经理Callum Weir以及监控机器人Tom总部位于英国的农业科技初创公司SRC(Small Robot Company),正在 ...

谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统
谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统

[2019-10-11]  训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统,测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件, ...

本周栏目热点

神经网络:人工智能以及我们的未来

[2016-11-20]   作者:James Crowder翻译:王益军审校:心原文链接:techcrunch把自己想象成在一辆未来的自动驾驶汽车的乘客。这辆汽车与你以一种 ...

[2016-11-20]   include "stdio h" include "stdlib h" include "time h" include "math h" *********************************************i ...

OpenAI开辟全新AI音乐领域,发布Jukebox神经网络生产歌曲

[2020-05-19]  日前,外媒报道,人工智能(AI)技术生成的音乐会给人们带来非常奇妙体验。其中有两大原因,第一,这是一个非常吸引人的全新领域;第二,这 ...

50行代码玩转生成对抗网络GAN模型!(附源码)

[2018-07-30]  本文为大家介绍了生成对抗网络(Generate Adversarial Network,GAN),以最直白的语言来讲解它,最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...