经典网络VGGNet介绍

经典网络VGGNet介绍经典网络 VGGNet 其中 VGG 为 VisualGeomet 由 KarenSimonya 等于 2014 年提出 论文名为 VeryDeepConv ScaleImageRe 论文见 https arxiv org pdf 1409 1556 pdf 网络结构如下图所示 其中 D 和 E 即为 VGG 16 和 VGG 19 下图是来自 https neurohive io en popular network

经典网络VGGNet(其中VGG为Visual Geometry Group)由Karen Simonyan等于2014年提出,论文名为《Very Deep Convolutional Networks for Large-Scale Image Recognition》,论文见:https://arxiv.org/pdf/1409.1556.pdf,网络结构如下图所示,其中D和E即为VGG-16和VGG-19:

经典网络VGGNet介绍

下图是来自https://neurohive.io/en/popular-networks/vgg16/ 中VGG-16架构的截图:

经典网络VGGNet介绍

VGG-16(13个卷积层+3个全连接层)与VGG-19(16个卷积层+3个全连接层)的区别:每个卷积层后跟ReLU

(1).VGG-16:2个卷积层+Max Pooling+2个卷积层+Max Pooling+3个卷积层+Max Pooling+3个卷积层+Max Pooling+3个卷积层+Max Pooling+3个全连接层。

(2).VGG-19:2个卷积层+Max Pooling+2个卷积层+Max Pooling+4个卷积层+Max Pooling+4个卷积层+Max Pooling+4个卷积层+Max Pooling+3个全连接层。

假如输入图像大小为n*n,过滤器(filter)为f*f,padding为p,步长(stride)为s,则输出大小为:如果商不是整数,向下取整,即floor函数。参考:https://blog.csdn.net/fengbingchun/article/details/

经典网络VGGNet介绍

VGGNet网络证明了增加网络深度有利于分类精度,使错误率下降。VGGNet模型应用到其它图像数据集上泛化性也很好。

VGGNet网络:

(1).结构简洁:卷积层+ReLU、最大池化层、全连接层、Softmax输出层。

(2).使用连续几个较小卷积核(3*3)替换AlexNet中的较大卷积核且采用same padding(即p=(f-1)/2),既减少参数,又进行了更多的非线性映射,可以增加网络的拟合能力。分为5段卷积,每段包括2至4卷积层。

(3).最大池化,小池化核(2*2),stride为2。

(4).通道数即feature maps数逐渐翻倍增加,使得更多的信息可以被提取出来。

(5).训练时将同一张图像缩放到不同的大小,在随机裁剪到224*224大小以及随机水平翻转,增加训练数据量。

(6).在测试阶段,将3个全连接层替换为3个卷积层,这样输入层可以接收任意宽或高的图像。

VGG-16架构:13个卷积层+3个全连接层,predict时对各层进行说明,参照:https://github.com/fengbingchun/Caffe_Test/blob/master/test_data/Net/VGG-16/vgg-16_deploy.prototxt

(1).输入层(Input):图像大小为224*224*3。

(2).卷积层1+ReLU:使用64个3*3的filter,stride为1,padding为1,输出为224*224*64,64个feature maps,训练参数(3*3*3*64)+64=1792。

(3).卷积层2+ReLU:使用64个3*3的filter,stride为1,padding为1,输出为224*224*64,64个feature maps,训练参数(3*3*64*64)+64=36928。

(4).最大池化层:filter为2*2,stride为2,padding为0,输出为112*112*64,64个feature maps。

(5).卷积层3+ReLU:使用128个3*3的filter,stride为1,padding为1,输出为112*112*128,128个feature maps,训练参数(3*3*64*128)+128=73856。

(6).卷积层4+ReLU:使用128个3*3的filter,stride为1,padding为1,输出为112*112*128,128个feature maps,训练参数(3*3*128*128)+128=。

(7). 最大池化层:filter为2*2,stride为2,padding为0,输出为56*56*128,128个feature maps。

(8).卷积层5+ReLU:使用256个3*3的filter,stride为1,padding为1,输出为56*56*256,256个feature maps,训练参数(3*3*128*256)+256=。

(9).卷积层6+ReLU:使用256个3*3的filter,stride为1,padding为1,输出为56*56*256,256个feature maps,训练参数(3*3*256*256)+256=。

(10).卷积层7+ReLU:使用256个3*3的filter,stride为1,padding为1,输出为56*56*256,256个feature maps,训练参数(3*3*256*256)+256=。

(11). 最大池化层:filter为2*2,stride为2,padding为0,输出为28*28*256,256个feature maps。

(12).卷积层8+ReLU:使用512个3*3的filter,stride为1,padding为1,输出为28*28*512,512个feature maps,训练参数(3*3*256*512)+512=。

(13).卷积层9+ReLU:使用512个3*3的filter,stride为1,padding为1,输出为28*28*512,512个feature maps,训练参数(3*3*512*512)+512=。

(14).卷积层10+ReLU:使用512个3*3的filter,stride为1,padding为1,输出为28*28*512,512个feature maps,训练参数(3*3*512*512)+512=。

(15). 最大池化层:filter为2*2,stride为2,padding为0,输出为14*14*512,512个feature maps。

(16).卷积层11+ReLU:使用512个3*3的filter,stride为1,padding为1,输出为14*14*512,512个feature maps,训练参数(3*3*512*512)+512=。

(17).卷积层12+ReLU:使用512个3*3的filter,stride为1,padding为1,输出为14*14*512,512个feature maps,训练参数(3*3*512*512)+512=。

(18).卷积层13+ReLU:使用512个3*3的filter,stride为1,padding为1,输出为14*14*512,512个feature maps,训练参数(3*3*512*512)+512=。

(19). 最大池化层:filter为2*2,stride为2,padding为0,输出为7*7*512,512个feature maps。

(20).全连接层1+ReLU+Dropout:有4096个神经元或4096个feature maps,训练参数(7*7*512)*4096=。

(21). 全连接层2+ReLU+Dropout:有4096个神经元或4096个feature maps,训练参数4096*4096=。

(22). 全连接层3:有1000个神经元或1000个feature maps,训练参数4096*1000=。

(23).输出层(Softmax):输出识别结果,看它究竟是1000个可能类别中的哪一个。

train和predict的可视化结果如下图所示:

经典网络VGGNet介绍

GitHub:https://github.com/fengbingchun/NN_Test

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/176158.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午10:35
下一篇 2026年3月26日 下午10:35


相关推荐

  • Dynamics crm2013 IFD部署后启用多组织

    Dynamics crm2013 IFD部署后启用多组织对 CRM 的多组织都不会陌生 在常规模式下新建组织后更改下 url 后面的组织名称即可访问新的组织了 而在部署 IFD 后就需要注意两点 1 域名的 DNS 解析 2 relyingpatry 的更新 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp 先说第一点域名解析 在 dns 管理器中添加新的 host 名 下图中的 org 是第一个组织 crm 是新添的组织 原有的组织的系统访问地址是 https org global com cn

    2026年1月14日
    3
  • oracle 11g安装教程_暖气片安装方法图解

    oracle 11g安装教程_暖气片安装方法图解Oracle11G安装图解标签(空格分隔):oracleOracle介绍  OracleDatabase,又名OracleRDBMS,或简称Oracle是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的

    2026年2月9日
    4
  • 自定义 MCP Server,在 cursor 中连接本地 MySQL 实现了统计分析

    自定义 MCP Server,在 cursor 中连接本地 MySQL 实现了统计分析

    2026年3月16日
    2
  • 免费分享仿某妹网站地址发布页源码

    免费分享仿某妹网站地址发布页源码用于网址跳转,防止网址被封或者丢失用。做什么就不用我多说了!我看你们全部都要金币。。。我就免费分享给你们。下载地址:点击下载

    2022年5月9日
    46
  • volatile关键字及其作用

    volatile关键字及其作用概述:本文主要介绍Java语言中的volatile关键字,内容涵盖volatile的保证内存可见性、禁止指令重排等。

    2022年5月31日
    35
  • RC522 射频读卡器模块(MINI型)

    RC522 射频读卡器模块(MINI型)一、硬件:二、[主芯片介绍]MFRC522是应用于13.56MHz非接触式通信中高集成度的读写卡芯片,是NXP公司针对“三表”应用推出的一款低电压、低成本、体积小的非接触式读写卡芯片,是智能仪表

    2022年7月1日
    39

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号