CNN经典论文研读之VGG网络及其tensorflow实现-神经网络-技术-爱吧机器人网

CNN经典论文研读之VGG网络及其tensorflow实现

2018-08-17 数据科学家养成记浏览量：

在前两期的论文研读中，笔者和大家一起学习了 LeNet-5 和 AlexNet 这两个经典的卷积神经网络结构和基本实现方式。今天我们继续 CNN 经典论文研读之路——VGGNet。VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和谷歌 DeepMind 一起研究出来的深度卷积神经网络，因而冠名为 VGG。在2014年的 ILSVRC 中取得了第二名的成绩，可能你会问这么厉害的网络为什么不是第一名，因为当年实际提交 VGG 版本时作者并未作进一步的优化，而当年的第一名则是我们后面要继续研读的 Google Inception Net。

相较于之前的 LeNet-5 和 AlexNet，VGGNet 结构中大量使用 3x3 的卷积核和 2x2 的池化核，首次将卷积神经网络的卷积深度推向更深，最为典型的 VGGNet 是 VGG16 和 VGG19，其中的 16 的含义即网络中包含16个卷积层和全连接层， 19即即网络中包含19个卷积层和全连接层。VGGNet 的网络虽然开始加深但其结构并不复杂，但作者的实践却证明了卷积网络深度的重要性。深度卷积网络能够提取图像低层次、中层次和高层次的特征，因而网络结构需要的一定的深度来提取图像不同层次的特征。

VGG的网络结构

在论文中，作者使用了 A-E 五个不同深度水平的卷积网络进行试验，从A到E网络深度不断加深：

各结构网络所含训练参数：

其中 D 和 E 即我们常说的 VGG16 和 VGG19。可以看到 VGG16 网络需要训练的参数数量达到了 1.38 亿个，这个数量是巨大的。我们以 VGG16 为例简单探究一下它的网络结构。
VGG16 各层的结构和参数如下：
C1-1层是个卷积层，其输入输出结构如下：
输入： 224 x 224 x 3 滤波器大小： 3 x 3 x 3 滤波器个数：64
输出： 224 x 224 x 64
C1-2层是个卷积层，其输入输出结构如下：
输入： 224 x 224 x 3 滤波器大小： 3 x 3 x 3 滤波器个数：64
输出： 224 x 224 x 64
P1层是C1-2后面的池化层，其输入输出结构如下：
输入： 224 x 224 x 64 滤波器大小： 2 x 2 滤波器个数：64
输出： 112 x 112 x 64
C2-1层是个卷积层，其输入输出结构如下：
输入： 112 x 112 x 64 滤波器大小： 3 x 3 x 64 滤波器个数：128
输出： 112 x 112 x 128
C2-2层是个卷积层，其输入输出结构如下：
输入： 112 x 112 x 64  滤波器大小： 3 x 3 x 64 滤波器个数：128
输出： 112 x 112 x 128
P2层是C2-2后面的池化层，其输入输出结构如下：
输入： 112 x 112 x 128 滤波器大小： 2 x 2 滤波器个数：128
输出： 56 x 56 x 128

C3-1层是个卷积层，其输入输出结构如下：
输入： 56 x 56 x 128  滤波器大小： 3 x 3 x 128 滤波器个数：256
输出： 56 x 56 x 256
C3-2层是个卷积层，其输入输出结构如下：
输入： 56 x 56 x 256  滤波器大小： 3 x 3 x 256 滤波器个数：256
输出： 56 x 56 x 256
C3-3层是个卷积层，其输入输出结构如下：
输入： 56 x 56 x 256  滤波器大小： 3 x 3 x 256 滤波器个数：256
输出： 56 x 56 x 256
P3层是C3-3后面的池化层，其输入输出结构如下：
输入： 56 x 56 x 256 滤波器大小： 2 x 2 滤波器个数：256
输出： 28 x 28 x 256
C4-1层是个卷积层，其输入输出结构如下：
输入： 28 x 28 x 256  滤波器大小： 3 x 3 x 256 滤波器个数：512
输出： 28 x 28 x 512
C4-2层是个卷积层，其输入输出结构如下：
输入： 28 x 28 x 512  滤波器大小： 3 x 3 x 256 滤波器个数：512
输出： 28 x 28 x 512
C4-3层是个卷积层，其输入输出结构如下：
输入： 28 x 28 x 512  滤波器大小： 3 x 3 x 256 滤波器个数：512
输出： 28 x 28 x 512
P4层是C4-3后面的池化层，其输入输出结构如下：
输入： 28 x 28 x 512 滤波器大小： 2 x 2 滤波器个数：512
输出： 14 x 14 x 512

C5-1层是个卷积层，其输入输出结构如下：
输入： 14 x 14 x 512  滤波器大小： 3 x 3 x 512 滤波器个数：512
输出： 14 x 14 x 512
C5-2层是个卷积层，其输入输出结构如下：
输入： 14 x 14 x 512  滤波器大小： 3 x 3 x 512 滤波器个数：512
输出： 14 x 14 x 512
C5-3层是个卷积层，其输入输出结构如下：
输入： 14 x 14 x 512  滤波器大小： 3 x 3 x 512 滤波器个数：512
输出： 14 x 14 x 512
P5层是C5-3后面的池化层，其输入输出结构如下：
输入： 14 x 14 x 512 滤波器大小： 2 x 2 滤波器个数：512
输出： 7 x 7 x 512
F6层是个全连接层，其输入输出结构如下：
输入：4096
输出：4096
F7层是个全连接层，其输入输出结构如下：
输入：4096
输出：4096
F8层也是个全连接层，即输出层，其输入输出结构如下：
输入：4096
输出：1000
大致过程如 NG 老师的演示图：

从上述的 VGG 结构分析中，我们可以看到这种网络结构非常规整，2-2-3-3-3的卷积结构也非常利于编程实现。卷积层的滤波器数量的变化也存在明显的规律，由64到128再到256和512，每一次卷积都是像素成规律的减少和通道数成规律的增加。

VGG16 的简单实现

原本自己利用 Tensoflow 简单写了个 VGG16 的网络结构，但去谷歌一搜发现别人的代码写的实在太好了，以至于这里就不用自己代码展示 VGG16 了。编写的思路无非就是定义卷积过程、池化过程和全连接过程，然后将其封装到 VGG16 的模型函数中去，其中注意一些编写细节即可。
笔者自己写的部分代码截图：

GitHub 上大佬的开源实现：

https://gist.github.com/ksimonyan/211839e770f7b538e2d8#file-readme-md

参考资料：
https://www.coursera.org/learn/machine-learning
https://www.deeplearning.ai/
https://gist.github.com/ksimonyan/211839e770f7b538e2d8#file-readme-md
黄文坚 tensorflow实战

精选推荐

人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23] 为搜索引擎过滤信息，棋盘游戏对弈，识别图像人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

麻省理工学院最新研究：优化软体机器人的控制和设计

[2019-11-24] 软体机器人属于一个新的领域，它可能在诸如外科手术等领域发挥重要作用（手术时的纳米机器人需要在人体内部移动而不损伤软组织）。软体机器 ...

美国Natilus公司试飞水上无人货机设计简单成本降低

[2017-12-28] Natilus创业公司成立于2014年，其梦想是建造大型无人机，以半价提供比船舶快得多国际货运。在十二月份，Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

揭秘达芬奇手术机器人

[2018-04-19] 达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局（FDA）于2000年通过该标准，旨在利用微创手段 ...

亚马逊计划建一个4000万美元的机器人中心

[2019-11-07] 爱吧机器人网消息，亚马逊11月6日宣布了一项计划，计划在美国马萨诸塞州韦斯特伯勒建立一个4000万美元、35万平方英尺的机器人创新中心。新 ...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24] 机器人的研究在过去10年中得益于一个具有嵌入式人工智能（AI）的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建，如今在欧洲、美国、韩国、新加坡和日本的实验室......

机器人从工业走向家庭库卡KUKA目标是引领中国市场

[2017-12-08] 机器人正在改变着人们的生活方式，而库卡KUKA想要在中国这个大蛋糕中占有一块大份额，库卡公司正在引领市场...

比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03] 软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用，而不会杀死他们，并拿起像西红柿这样柔软的物体。” 从长远来看，布鲁塞尔大学队伍正在努力创建一个类似的材......

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

神经网络：人工智能以及我们的未来

[2016-11-20] 作者：James Crowder翻译：王益军审校：心原文链接：techcrunch把自己想象成在一辆未来的自动驾驶汽车的乘客。这辆汽车与你以一种 ...

改进的BP神经网络算法(C语言源码)

[2016-11-20] include "stdio h" include "stdlib h" include "time h" include "math h" *********************************************i ...

OpenAI开辟全新AI音乐领域，发布Jukebox神经网络生产歌曲

[2020-05-19] 日前，外媒报道，人工智能（AI）技术生成的音乐会给人们带来非常奇妙体验。其中有两大原因，第一，这是一个非常吸引人的全新领域；第二，这 ...

50行代码玩转生成对抗网络GAN模型！（附源码）

[2018-07-30] 本文为大家介绍了生成对抗网络（Generate Adversarial Network，GAN），以最直白的语言来讲解它，最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06] 爱吧机器人网编者按：近日，《自然-神经科学》发表了一篇论文，研究人员创建了一种深度人工神经网络，能够准确预测生物大脑对视觉刺激所产 ...