VGG
全称是Visual Geometry Group
,因为是由Oxford
的Visual Geometry Group
提出的。AlexNet
问世之后,很多学者通过改进AlexNet
的网络结构来提高自己的准确率,主要有两个方向:小卷积核和多尺度。而VGG
的作者们则选择了另外一个方向,即加深网络深度。
卷积网络的输入是224 * 224
的RGB
图像,整个网络的组成是非常格式化的,基本上都用的是3 * 3
的卷积核以及 2 * 2
的max pooling
,少部分网络加入了1 * 1
的卷积核。因为想要体现出“上下左右中”的概念,3*3
的卷积核已经是最小的尺寸了。
解释两个关键问题:
下图是VGG16
的网络架构:
首先放上作者用来做对比实验的六组网络。
简单介绍一下各组的区别:
LRN
,这是AlexNet
里提出来的,不需要怎么了解,基本很少使用了。1 * 1
的kernel
。1 * 1
的卷积核替换成了3 * 3
的,即VGG16
。3*3
卷积层,即VGG19
。因篇幅问题不能全部显示,请点此查看更多更全内容