神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程1反向传播算法和BP网络简介误差反向传播算法简称反向传播算法(即BP算法)。使用反向传播算法的多层感知器又称为BP神经网络。BP算法是一个迭代算法,它的基本思想为:(1)先计算每一层的状态和激活值,直到最后一层(即信号是前向传播的);(2)计算每一层的误差,误差的计算过程是从最后一层向前推进的(这就是反向传播算法名字的由来);(3)更新参数(目标是误差变小)。迭代前面两个步骤,直到满足…

大家好,又见面了,我是你们的朋友全栈君。

1  反向传播算法和BP网络简介

 

    误差反向传播算法简称反向传播算法(即BP算法)。使用反向传播算法的多层感知器又称为BP神经网络。BP算法是一个迭代算法,它的基本思想为:(1)先计算每一层的状态和激活值,直到最后一层(即信号是前向传播的);(2)计算每一层的误差,误差的计算过程是从最后一层向前推进的(这就是反向传播算法名字的由来);(3)更新参数(目标是误差变小)。迭代前面两个步骤,直到满足停止准则(比如相邻两次迭代的误差的差别很小)。

    本文的记号说明:

 神经网络BP反向传播算法原理和详细推导流程

 

 

下面以三层感知器(即只含有一个隐藏层的多层感知器)为例介绍“反向传播算法(BP 算法)”。

神经网络BP反向传播算法原理和详细推导流程

2 信息前向传播

 

神经网络BP反向传播算法原理和详细推导流程

 

3 误差反向传播

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

3.1 输出层的权重参数更新

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

3.2  隐藏层的权重参数更新

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

3.3输出层和隐藏层的偏置参数更新

神经网络BP反向传播算法原理和详细推导流程

神经网络BP反向传播算法原理和详细推导流程

3.4 BP算法四个核心公式

神经网络BP反向传播算法原理和详细推导流程

 

3.5 BP 算法计算某个训练数据的代价函数对参数的偏导数

神经网络BP反向传播算法原理和详细推导流程
神经网络BP反向传播算法原理和详细推导流程
神经网络BP反向传播算法原理和详细推导流程

3.6 BP 算法总结:用“批量梯度下降”算法更新参数

神经网络BP反向传播算法原理和详细推导流程
神经网络BP反向传播算法原理和详细推导流程

4 梯度消失问题及其解决办法

神经网络BP反向传播算法原理和详细推导流程

5 加快 BP 网络训练速度:Rprop 算法

神经网络BP反向传播算法原理和详细推导流程

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130939.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 寻找最长回文子串

    寻找最长回文子串最长回文子串的问题描述:给出一个字符串S,求S的最长回文子串的长度。样例:字符串”PATZJUJZTACCBCC”的最长回文子串为“ATZJUJZTA”,长度为9。先看暴力解法:枚举子串的两个端点i和j,判断在i,区间内的子串是否回文。从复杂度上来看,枚举端点需要O(n2),判断回文需要O(n),因此总复杂度是O(n3)。介绍动态规划的方法,使用动态规划可以达到…

    2022年5月22日
    40
  • 软件安装(五):Wireshark安装详细教程

    软件安装(五):Wireshark安装详细教程参考网络分析工具——WireShark的使用(超详细)Wireshark安装+使用(一)

    2022年6月22日
    25
  • java分割字符串(特殊字符) split

    java分割字符串(特殊字符) split使用 java 中的 split 方法分割包含特殊字符的字符串

    2025年8月2日
    6
  • 视频中的车牌特征识别[通俗易懂]

    视频中的车牌特征识别[通俗易懂]这里,没有直接采用之前的方案,是因为在设计的时候,发现直接采用颜色等直接特征提取然后进行二值化处理的方法,如果视频中出现颜色类似的区域,则很有可能错误的定位,例如在公交车中车牌区域范围和前窗以及部分的背景比较相似,直接采用这种方法会出错。这里,定位的算法,我们使用的是HOG特征提取和Adaboost的算法进行定位。对应的程序为:具体的原理如下所示:adaboost:http://www.doc88.com/p-211656392…

    2022年5月15日
    51
  • 常用的Java工具,16个

    常用的Java工具,16个在Java中,工具类定义了一组公共方法,这篇文章将介绍Java中使用最频繁及最通用的Java工具类。以下工具类、方法按使用流行度排名,参考数据来源于Github上随机选取的5万个开源项目源码。一.org.apache.commons.io.IOUtilscloseQuietly:关闭一个IO流、socket、或者selector且不抛出异常,通常放在finally块toString:转换IO流、Uri、byte[]为Stringcopy:IO流数据复制,从输入流写到输出流中,最大支持2GB

    2022年7月7日
    29
  • JavaScript离别之作——HTML元素操作

    JavaScript离别之作——HTML元素操作JavaScript离别之作——HTML元素操作

    2022年7月19日
    19

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号