GoogLeNet v1结构「建议收藏」

全栈程序员-站长 • 2022年8月14日下午10:16 • 未分类 • 阅读 11

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元售后保障童叟无欺

GoogLeNet

Inception块
GoogLeNet

GoogLeNet是google2014年推出的深度神经网络模型，原论文名称为：Going deeper with convolutions，在沐神的书上也被叫做含并⾏连结的⽹络（主要由于Inception块中的结构）。该模型在2014年ILSVRC 2014比赛中竞赛中夺得冠军，14年之后也在不断发展，这里就介绍一下初始的版本。

Inception块

GoogLeNet思想有点类似于VGG，先构建块，网络主要通过块的堆叠实现，不过这里的块与VGG块不同，称之为Inception，GoogLeNet的核心就是Inception块，一个Inception块的结构如下图：

一个Inception块可以说是集合了LeNet，AlexNet，NiN，VGG其中的架构，包括3×3卷积层、1×1卷积层、5×5卷积层和池化层，可以从上图看到，Inception块与其他的什么VGG块、NiN块不一样的是，VGG与NiN块内部都是一条路的运算，而一个Inception块包括4条路，将输入通过不同的路得到不同的输出（注意这里的输出形状都是一样的），然后将这些输出在channel方向concat起来得到一个Inception的最后输出。我们从左到右将路记为第1，2，3，4路，一个Inception块的这些路具体介绍如下：
第一条路： 只用到了1×1的卷积核，所以输出不改变原输入的形状，输出channel数为超参数。
第二条路： 用到了1×1卷积核与3×3卷积核，1×1卷积层不改变输入形状，channel数自定，3×3卷积层的padding为1，即分别在四周添1行列，stride为1，输出的形状为 $(n - 3 + 2 + 1) / 1 = n$ （n为输入长或者高），所以可以看到输出形状还是与输入相同，但channel数不一样。
第三条路： 用到了1×1卷积核与5×5卷积核，1×1卷积层不改变输入形状，channel数自定，5×5卷积层的padding为2，即分别在四周添加2行列，输出形状为 $(n - 5 + 4 + 1) / 1 = n$ （n为输入长或者高），所以可以看到输出形状还是与输入相同，但channel数不一样。
第四条路： 用到了3×3最大池化与1×1卷积，最大池化的padding为1，每个channel输出形状还是与输入相同，接一个1×1的卷积层，也不改变输入形状。
最后将这四条路的输出按照通道数方向合并，得到一个Inception块的最后输出。
第一个Inception块可由下图表示（来自沐神）：
第一个Inception块描述

GoogLeNet

GoogLeNet核心就是不同Inception块的堆叠，原作者使用的是9个Inception块，我们可以把GoogLeNet分成5段，称之为5个stage，具体结构如下：
在这里插入图片描述
具体来说，GoogLeNet开始使用一个7×7的卷积层，3×3的最大池化；1×1卷积层，3×3的最大池化，3×3的最大池化；然后是两个Inception块，当然前一个块的输出形状要对应后一个块的输入形状，接一个3×3的最大池化；5个Inception块，接一个3×3的最大池化；2个Inception块，接一个全局平均池化，最后接一个全连接得到最后输出。