卷积神经网络(3)—-经典网络

卷积神经网络(3)—-经典网络

卷积层要提升表达能力,主要依靠增加输出通道数,副作用是计算量增大和过拟合。

一、历史过程:

卷积神经网络(3)----经典网络

二、经典网络

1、LeNet:两层卷积+池化,两层全连接

卷积神经网络(3)----经典网络

卷积神经网络(3)----经典网络

 

2、AlexNet:5个卷积层、5个池化层、3个全连接层【大约5000万个参数】,最后一个全连接层输出到一个1000维的softmax层,产生一个1000类的分类。

优点:

卷积神经网络(3)----经典网络

采用了非线性激活函数relu替代了sigmoid,SGD的收敛速度会比sigmoid/tanh快很多。

卷积神经网络(3)----经典网络

 

3、VGG是加强版的AlexNet:

13个卷积层【5段卷积层(2+2+3+3+3),5个池化层】、3个全连接层【两个全连接图像特征,1层全连接分类特征】,但其增强了卷积层的功能。即AlexNet采用了8层卷积层(如以下配置A层),但VGG采用了16层和19层(如以下配置的C、D、E层)。

卷积神经网络(3)----经典网络

 

卷积神经网络(3)----经典网络

 

4、GoogleNet(Inception结构):

https://blog.csdn.net/transMaple/article/details/78439710

以上的网络主要是纵向延伸,GoogleNet考虑了横向延伸。

主要围绕深度和宽度来实现的:

深度:层数更深,采用了22层,为了避免梯度消失,GoogleNet在不同深度处增加了两个损失函数来避免反向传播时梯度消失的现象。

宽度:增加了多种大小的卷积核,如1*1,3*3,5*5。采用了降维的Inception模型,在3*3、5*5卷积前,和最大池化后都分布加上了1*1的卷积核,起到了降低特征映射厚度的作用。

整个网络:

卷积神经网络(3)----经典网络

 绿色框内就是Inception结构,如下图模型。

在传统的转换网络中,每个层从前一层提取信息,以便将输入数据变换成更有用的表示。然而,每个层类型提取不同种类的信息。5×5卷积核的输出告诉我们与3×3卷积核的输出不同的东西,这告诉我们与最大池内核的输出不同,等等。在任何给定的层面,我们如何知道什么转换提供了最有用的信息?
为什么不让模型选择?
于是Inception将1×1, 3×3, 5×5, max-pool结合起来,让网络选择,最后通过一个聚合操作合并(在输出通道数这个维度上聚合)

卷积神经网络(3)----经典网络

这种模块的意义是,你可能不清楚用一个小的感受野效果好还是大的感受野效果好,可以把这些放一起来评判

关键点:
– 横向扩展
– 使用了1×1的filter,可以很方便的改变卷积结果的层数(1×1的filter也被称为bottleneck),性价比高,很小的计算量能增加一层特征变换和非线性化。

 GooleNet分三种:Inception V1(22层)、Inception V2、Inception V3

  1. Inception V1的最大特点是控制了计算量和参数量的同时,获得很好的分类性能。【参数量降低,但准确率上升】
  • 降低参数量的目的有两点:

第一,参数越多模型越庞大,需提供学习的数据量更大。

第二,参数越多,耗费的计算资源更大。

  • 参数少效果好的原因:

一、模型层数深、表达能力更强。

二、去除了最后的全连接层,全局平均池化层(即将图片尺寸变为 1 × 1)来取代它。【全连接层具有大部分的参数且会引起过拟合,采用全局平均池化层采用了NIN思想。】

三、Inception V1中的Inception Module提高了参数的利用率。Inception Module如大网络中的一个小网络,其结构可反复堆叠在一起形成大网络。Inception V1比NIN增加了分支网络,NIN则主要是级联的卷积层和MLPConv层。

  1. Inception V2:采用了两个3*3的卷积代替5*5的大卷积,还提出了BN(批标准化)方法。
  2. Inception V3:将一个较大的二维卷积拆成两个较小的一维卷积,如7*7卷积拆成1*7卷积和7*1卷积。

 

5、残差网络:ResNets

采用了 跳远连接。即a【l+2】= g(Z【l+2】 + a【l】),a【l】作为a【l+2】的残差,g为激活函数。

起作用的原因是:假如Z【l+2】=0,则a【l+2】=a【l】。有时候神经网络深度过大,则

卷积神经网络(3)----经典网络

卷积神经网络(3)----经典网络

 

转载于:https://www.cnblogs.com/Lee-yl/p/10015541.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/101298.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Spring 中的 18 个注解,你会几个?

    Spring 中的 18 个注解,你会几个?

    2021年7月8日
    91
  • Ubuntu安装和配置ssh

    Ubuntu安装和配置ssh因为配置pypbc环境,需要windows系统下PycharmSSH连接虚拟机python环境1.安装ssh服务器sudoaptinstallopenssh-server2.安装ssh客

    2022年7月1日
    21
  • springcloud原理详解_SpringMVC运行原理

    springcloud原理详解_SpringMVC运行原理SpringCloudEureka原理分析一、Eureka的基础架构及服务治理机制  Eureka服务治理的基础架构包含三个核心:服务注册中心、服务提供者、服务消费者。其中服务注册中心,即Eureka提供的服务端,提供服务注册和发现的功能;服务提供者,即将自己的服务注册到注册中心;服务的消费者,从注册中心获取服务列表,从而使消费者知道到何处调用服务,服务消费可以使用Ribbon、Feign等。1、服务提供者:服务注册:服务提供者在项目启动时,会通过发送REST请求的方式将自己注册到eure

    2022年10月21日
    1
  • Offline Explorer_手机chrome离线网页

    Offline Explorer_手机chrome离线网页提及离线浏览软件,我想大家都知道“元老级”的TeleportPro吧?一些网友可能还挺怀念的,毕竟它开了离线浏览之先河,为广大网友节省了不少银子,带来了不少便利,功不可没呵!然而时过境迁,“江山代有才人出”,一大批新的离线浏览软件登场了。这里我要向大家介绍的是一个设计全新的离线浏览软件——OfflineExplorer1.1。一、基本信息 OfflineExplorer1.1由MetaP…

    2022年9月8日
    0
  • 大数据认知作业[通俗易懂]

    大数据认知作业[通俗易懂]大数据认知实习作业目录关于作者关于大数据我对大数据的认识目前大数据应用利用大数据的实例大数据分析交通目录关于作者各位博友大家好,我是新晋小白JW,作为一名刚步入学习的小白,我会发表一些我的主观看法,望大家多多指导关于大数据大数据(bigdata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低的四大特征。大数据的5V

    2022年6月1日
    33
  • Spring整合Sharding-JDBC分库分表详情

    Spring整合Sharding-JDBC分库分表详情Spring整合Sharding-JDBC分库分表详情一、概述最初线上系统的业务量不是很大,业务数据量并不大,比如说单库的数据量在百万级别以下(事实上千万级别以下都还能支撑),那么MySQL的单库即可完成任何增/删/改/查的业务操作。随着业务的发展,单个DB中保存的数据量(用户、订单、计费明细和权限规则等数据)呈现指数级增长,那么各种业务处理操作都会面临单DB的IO读写瓶颈带来的性能问题。S…

    2022年6月14日
    25

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号