深度学习笔记(七)–ResNet(残差网络)

深度学习笔记(七)–ResNet(残差网络)内容来自吴恩达老师视频,网易云课堂有哦ResNets非常非常深的神经网络是很难训练的,因为存在梯度消失和梯度爆炸问题。ResNets是由残差块(Residualblock)构建的,首先解释一下什么是残差块。这是一个两层神经网络,在层进行激活,得到,再次进行激活,两层之后得到。计算过程是从开始,首先进行线性激活,根据这个公式:,通过算出,即乘以权重矩阵,再加上偏差因…

大家好,又见面了,我是你们的朋友全栈君。

内容来自吴恩达老师视频,网易云课堂有哦

ResNets

非常非常深的神经网络是很难训练的,因为存在梯度消失和梯度爆炸问题。ResNets是由残差块(Residual block构建的,首先解释一下什么是残差块。

深度学习笔记(七)--ResNet(残差网络)

这是一个两层神经网络,在深度学习笔记(七)--ResNet(残差网络) 层进行激活,得到深度学习笔记(七)--ResNet(残差网络) ,再次进行激活,两层之后得到深度学习笔记(七)--ResNet(残差网络) 。计算过程是从深度学习笔记(七)--ResNet(残差网络) 开始,首先进行线性激活,根据这个公式:深度学习笔记(七)--ResNet(残差网络) ,通过深度学习笔记(七)--ResNet(残差网络) 算出深度学习笔记(七)--ResNet(残差网络) ,即深度学习笔记(七)--ResNet(残差网络) 乘以权重矩阵,再加上偏差因子。然后通过ReLU非线性激活函数得到深度学习笔记(七)--ResNet(残差网络)深度学习笔记(七)--ResNet(残差网络) 计算得出。接着再次进行线性激活,依据等式深度学习笔记(七)--ResNet(残差网络) ,最后根据这个等式再次进行ReLu非线性激活,即深度学习笔记(七)--ResNet(残差网络) ,这里的深度学习笔记(七)--ResNet(残差网络) 是指ReLU非线性函数,得到的结果就是深度学习笔记(七)--ResNet(残差网络) 。换句话说,信息流从深度学习笔记(七)--ResNet(残差网络)深度学习笔记(七)--ResNet(残差网络) 需要经过以上所有步骤,即这组网络层的主路径。 

深度学习笔记(七)--ResNet(残差网络)

在残差网络中有一点变化,我们将深度学习笔记(七)--ResNet(残差网络) 直接向后,拷贝到神经网络的深层,在ReLU非线性激活函数前加上深度学习笔记(七)--ResNet(残差网络) ,这是一条捷径。]深度学习笔记(七)--ResNet(残差网络) 的信息直接到达神经网络的深层,不再沿着主路径传递,这就意味着最后这个等式深度学习笔记(七)--ResNet(残差网络) )去掉了,取而代之的是另一个ReLU非线性函数,仍然对深度学习笔记(七)--ResNet(残差网络) 进行深度学习笔记(七)--ResNet(残差网络) 函数处理,但这次要加上深度学习笔记(七)--ResNet(残差网络)即:深度学习笔记(七)--ResNet(残差网络)也就是加上的这个深度学习笔记(七)--ResNet(残差网络) 产生了一个残差块。 

深度学习笔记(七)--ResNet(残差网络)

在上面这个图中,我们也可以画一条捷径,直达第二层。实际上这条捷径是在进行ReLU非线性激活函数之前加上的,而这里的每一个节点都执行了线性函数和ReLU激活函数。所以深度学习笔记(七)--ResNet(残差网络) 插入的时机是在线性激活之后,ReLU激活之前。除了捷径,你还会听到另一个术语“跳跃连接”,就是指深度学习笔记(七)--ResNet(残差网络) 跳过一层或者好几层,从而将信息传递到神经网络的更深层

ResNet的发明者是何恺明Kaiming He)、张翔宇Xiangyu Zhang)、任少卿Shaoqing Ren)和孙剑Jiangxi Sun),他们发现使用残差块能够训练更深的神经网络。所以构建一个ResNet网络就是通过将很多这样的残差块堆积在一起,形成一个很深神经网络,我们来看看这个网络。

深度学习笔记(七)--ResNet(残差网络)

这并不是一个残差网络,而是一个普通网络(Plain network,这个术语来自ResNet论文。

深度学习笔记(七)--ResNet(残差网络)

 把它变成ResNet的方法是加上所有跳跃连接,每两层增加一个捷径,构成一个残差块。如图所示,5个残差块连接在一起构成一个残差网络。

 深度学习笔记(七)--ResNet(残差网络)

       如果我们使用标准优化算法训练一个普通网络,比如说梯度下降法,或者其它热门的优化算法。如果没有残差,没有这些捷径或者跳跃连接,凭经验你会发现随着网络深度的加深,训练错误会先减少,然后增多。而理论上,随着网络深度的加深,应该训练得越来越好才对。也就是说,理论上网络深度越深越好。但实际上,如果没有残差网络,对于一个普通网络来说,深度越深意味着用优化算法越难训练。实际上,随着网络深度的加深,训练错误会越来越多

        但有了ResNets就不一样了,即使网络再深,训练的表现却不错,比如说训练误差减少,就算是训练深达100层的网络也不例外。有人甚至在1000多层的神经网络中做过实验,尽管目前我还没有看到太多实际应用。但是对深度学习笔记(七)--ResNet(残差网络) 的激活,或者这些中间的激活能够到达网络的更深层。这种方式确实有助于解决梯度消失和梯度爆炸问题,让我们在训练更深网络的同时,又能保证良好的性能。也许从另外一个角度来看,随着网络越来深,网络连接会变得臃肿,但是ResNet确实在训练深度网络方面非常有效。 

微信公众号:任冬学编程
tx工作的后端开发仔,分享后端技术、机器学习、数据结构与算法、计算机基础、程序员面试等话题。欢迎关注。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/148983.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 2021 Navicat 15 for MySQL激活码(JetBrains全家桶)

    (2021 Navicat 15 for MySQL激活码)2021最新分享一个能用的的激活码出来,希望能帮到需要激活的朋友。目前这个是能用的,但是用的人多了之后也会失效,会不定时更新的,大家持续关注此网站~IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html…

    2022年3月27日
    135
  • AvalonDock 2.0 的简单运用

    AvalonDock 2.0 的简单运用最近在研究AvalonDock的一些使用,碰到了一些问题。现在拿出来跟大家分享分享。网上找了一大把AvalonDock1.3版本的资料,弄出Demo后发现属性面板(DockableContent)设置成浮动后不能停靠其它的面板。最后只得试试AvalonDock2.0版本的,还好2.0版本没让我们失望。首先需要库文件:Xceed.Wpf.AvalonDock…

    2022年7月20日
    19
  • python机器学习库sklearn——Lasso回归(L1正则化)

    python机器学习库sklearn——Lasso回归(L1正则化)全栈工程师开发手册(作者:栾鹏)python数据挖掘系列教程TheLasso是估计稀疏系数的线性模型。它在一些情况下是有用的,因为它倾向于使用具有较少参数值的情况,有效地减少给定解决方案所依赖变量的数量。因此,Lasso及其变体是压缩感知领域的基础。在一定条件下,它可以恢复一组非零权重的精确集。在数学公式表达上,它由一个带有ℓ1\ell_1先验的正则项的线性模型组成。

    2022年6月14日
    95
  • gridview列的汇总

    gridview列的汇总

    2021年8月15日
    69
  • 最小可用maven+springboot 项目(无法使用外网,但是有maven私库情况)

    最小可用maven+springboot 项目(无法使用外网,但是有maven私库情况)用的是ideal,jdk1.8具体操作,参考下面链接。致谢:感谢下面作者的博客https://blog.csdn.net/weixin_43293627/article/details/82877418https://blog.csdn.net/u011948899/article/details/78159027https://www.phpsong.com/3463.ht…

    2022年7月18日
    11
  • 电脑快速切换ip软件(好用的换ip软件)

    切换IP软件,切换电脑手机IP如此简单大家在工作和生活中肯定会时不时遇到需要换IP的情况,为了预防需要换IP的时候束手无策,小编在此给大家介绍一款专门用来换IP的软件。打开搜索引擎,不管是百度,狗搜还是360,只要在上面搜索“换IP软件”,立马就会出现非常多的换IP的品牌,有免费的也有付费的,功能都没什么区别,就是换IP。卖IP的这么多,说明换IP的市场还是非常大的!不管你是做什么行业,网络推…

    2022年4月18日
    83

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号