为什么使用全局平均池化层?[通俗易懂]

为什么使用全局平均池化层?1、全连接层:、全连接网络可以使featuremap的维度减少,进而输入到softmax、全连接层的参数超多、会造成过拟合、模型本身变得非常臃肿2、全局平均池化层(globalaveragepoolilng)[GAP]:、直接实现了降维、极大地减少了网络的参数、对整个网路在结构上做正则化防止过拟合,直接赋予了每个channel实际的内别意义、gap可能会造成收敛速度减慢3、为什么会收敛速度变慢?以及对模型训练有什么差异?、全连接层结构的模型对于训练学习

大家好,又见面了,我是你们的朋友全栈君。

为什么使用全局平均池化层?

1、全连接层:
、全连接网络可以使feature map的维度减少,进而输入到softmax
、全连接层的参数超多
、会造成过拟合
、模型本身变得非常臃肿
2、全局平均池化层(global average poolilng)[GAP]:
、直接实现了降维
、极大地减少了网络的参数
、对整个网路在结构上做正则化防止过拟合,直接赋予了每个channel实际的内别意义
gap可能会造成收敛速度减慢
3、为什么会收敛速度变慢?以及对模型训练有什么差异?
、全连接层结构的模型对于训练学习的过程,压力更多在全连接层,卷积的特征学习低级一些,但是在不断学习调整参数中,一样效果不差。
、GAP 在学习训练的压力前导于卷积层,卷积的特征学习会高级一些,但也会淡化不同特征间的相对位置的组合关系,丢失了图像的位置信息,因此卷积训练出来的特征应该更加‘高级’。
、以上推到出一个结论:不利于迁移学习,那就调正卷积出来的特征。

提供建议:
全局平均池化层+softmax层代替FC层,效果要好。
全局平均池化层以后也可以试一试dropout,进行正则化。无论采用何种方法,毕竟全局池化是比较火的用法,采用正则至少不用被过拟合的象限困扰。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/128401.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月11日 下午9:40
下一篇 2022年4月11日 下午10:00


相关推荐

  • iframe标签详解

    iframe标签详解在我们的页面中可能会需要用到 点击链接页面的某一块变成其他的页面 这时候 iframe 的作用就显现出来了 iframe 元素会创建包含另外一个文档的内联框架 即行内框架 这里所说的内联框架指的就是达到类似于将代码插入到 html 文档中的效果 现在 html5 的出现又个他添加了一些其他的属性如下

    2026年3月17日
    2
  • POJ 1252 Euro Efficiency

    POJ 1252 Euro Efficiency

    2022年1月8日
    53
  • python怎么判断质数和合数_用java如何写代码去判断质数和合数

    python怎么判断质数和合数_用java如何写代码去判断质数和合数展开全部首先介绍下 质数是除了本身和 afe59b9ee7ad 以外 没有质因数 就是没有数能够整除之 合数是除了本身和 1 以外还有第三个数能整除之 具体示例代码如下 publicclassD publicstatic String args Scannerscan newSca

    2026年3月16日
    2
  • .pfx数字证书制作及操作使用

    .pfx数字证书制作及操作使用#.pfx数字证书制作及操作使用使用工具.pfx创建从*.pfx文件提取密钥Java代码操作#工具下载地址链接:http://pan.baidu.com/s/1jHOyIQa密码:aund#创建.pfxCN=名称(一般填公司名称)OU=单位名称O=作者名称L=地区C=国家第一步打开CertManager

    2022年5月20日
    150
  • MATLAB中LSTM算法实例_bresenham直线算法

    MATLAB中LSTM算法实例_bresenham直线算法Gauss-Newton算法MATLAB实现结果回顾算法实现总结结果回顾Gauss-Newton算法对Gauss-newton算法做了详细的解释,并且使用C++做了实例程序。但是程序其实有微小错误,实际的坐标并不是年代1815—1885,而是1—8,否则p=A∗exp(B∗t)p=A*exp(B*t)p=A∗exp(B∗t)拟合时将会迅速增大,也得不到A=0.7A=0.7A=0.7…

    2022年10月1日
    5
  • 关于Java并发编程的总结和思考

    关于Java并发编程的总结和思考编写优质的并发代码是一件难度极高的事情 Java 语言从第一版本开始内置了对多线程的支持 这一点在当年是非常了不起的 但是当我们对并发编程有了更深刻的认识和更多的实践后 实现并发编程就有了更多的方案和更好的选择 本文是对并发编程的一点总结和思考 同时也分享了 Java5 以后的版本中如何编写并发代码的一点点经验

    2026年3月18日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号