《人工神经网络原理》读书笔记(六)-Boltzmann机[通俗易懂]

《人工神经网络原理》读书笔记(六)-Boltzmann机[通俗易懂]全部笔记的汇总贴:《人工神经网络原理》-读书笔记汇总一、随机型神经网络的提出BP和Hopfield网络陷入局部最小点的原因网络误差或能量函数构成了含有多个极小点的非线性超曲面;网络误差或能量函数只能按照梯度下降方向单调变化,而不能有任何上升趋势。随机型神经网络的基本思想不但能够让网络误差或能量函数按照梯度下降方向变化,也能够让它们按照某种方式向梯度上升方向变化,这样才有可能使网络跳出局部极小点而向全局极小点收敛。随机型神经网络的特点神经元的输出状态有概率决定;网络连接权值的调整

大家好,又见面了,我是你们的朋友全栈君。

全部笔记的汇总贴:《人工神经网络原理》-读书笔记汇总

一、随机型神经网络的提出

BP和Hopfield网络陷入局部最小点的原因

  • 网络误差或能量函数构成了含有多个极小点的非线性超曲面;
  • 网络误差或能量函数只能按照梯度下降方向单调变化,而不能有任何上升趋势。

在这里插入图片描述
随机型神经网络的基本思想

  • 不但能够让网络误差或能量函数按照梯度下降方向变化,也能够让它们按照某种方式向梯度上升方向变化,这样才有可能使网络跳出局部极小点而向全局极小点收敛。

随机型神经网络的特点

  • 神经元的输出状态有概率决定;
  • 网络连接权值的调整按照某种概率分布进行处理;
  • 网络状态的转移由某种概率分布决定。

Boltzmann机

  • 是一种典型的随机型神经网络
  • 是第一个受统计力学启发得到的神经网络
  • 其名称来源于Boltzmann在统计热力学中的早期工作和网络本身的动态分布行为
  • 是Hinton等人以模拟退火思想为基础,在离散型Hopfield神经网络的基础上引入随机机制得到的

二、Boltzmann机的网络结构

介于BP神经网络的多层层次结构与离散型Hopfield神经网络的单层全互连结构之间。

网络中的 n n n个神经元之间相互连接,为双向对称连接结构,即 w i j = w j i w_{ij}=w_{ji} wij=wji

在这里插入图片描述
每个神经元到自身都无反馈,即 w i i = 0 w_{ii}=0 wii=0

每个神经元的输出 x j x_j xj均为0、1二值离散输出。

n n n个神经元的状态集合构成了Boltzmann机网络的状态。

n n n个神经元分为可视层与隐含层两大部分,其中的可视层又继续分为输入部分和输出部分,但这些层次在Boltzmann机中没有明显的划分界限。

三、Boltzmann机处理单元模型

在这里插入图片描述
在这里插入图片描述

四、Boltzmann机的能量函数

Boltzmann机的能量函数为 E = − 1 2 ∑ i = 1 n ∑ j = 1 n w i j x i x j + ∑ i = 1 n θ i x i E=-\frac12\sum_{i=1}^n\sum_{j=1}^nw_{ij}x_ix_j+\sum_{i=1}^n\theta_ix_i E=21i=1nj=1nwijxixj+i=1nθixi

随着Boltzmann机的运行,从概率意义上说,网络的能量呈下降趋势。这意味着在网络状态的演化过程中,尽管网络能量总的变化趋势是下降的,但不能排除在某一时刻某个神经元按照小概率事件进行状态变化,从而使网络的能量暂时上升。

五、Boltzmann机的Boltzmann分布

Boltzmann机网络处于某一状态的概率主要取决于网络在该状态下的能量,某个网络状态对应的能量越低,该状态出现的概率就越大;某个网络状态对应的能量越高,该状态出现的概率就越低。

在网络状态反复更新,并且更新次数足够大时,网络中某个状态出现的概率服从Boltzmann分布 P ( E i ) = e − E i T ∑ i = 1 m e − E i T P(E_i)=\frac{e^{-\frac{E_i}T}}{\sum_{i=1}^me^{-\frac{E_i}T}} P(Ei)=i=1meTEieTEi

特点

  • 最小能量状态以最大的概率出现
  • Boltzmann机处于某一状态的概率取决于网络温度参数 T T T
    当温度 T T T很高时,网络各个不同状态出现的概率非常接近,网络比较容易跳出局部极小点而达到全局最小点;
    当温度 T T T较低时,网络各个不同状态出现的概率差异较大,网络落入全局最小点或局部极小点后,虽然存在着一定的跳出可能性,但是其跳出概率较小。

六、Boltzmann机的运行规则

模拟退火算法

基本思路

  • 将神经元看作金属内部的“粒子”,神经网络的状态就是各个粒子的状态集合,神经网络在各个状态下的能量就是粒子所处的能态。如果在神经网络的运行中设置一个控制参数 T T T模拟金属退火过程中的温度,使得 T T T较大时,网络能量由低向高变化的可能性较大, T T T较小时,网络能量由低向高变化的可能性较小,那么在 T T T从高向低变化缓慢下降时,整个神经网络的状态的变化过程就模拟了金属的退火过程,当参数 T T T下降到一定程度时,网络将收敛于能量的最小值。

在这里插入图片描述
在这里插入图片描述

网络运行规则

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

七、Boltzmann机的学习规则

Boltzmann机实现联想记忆的实质是网络通过学习目标概率分布函数,将其记忆在网络的连接权值上,并在以后的回忆阶段能够将这一概率分布再现出来。

当Boltzmann机按照运行规则使网络状态发生转移的次数足够多时网络中各个状态的出现将服从Boltzmann分布。将Boltzmann分布获得的网络状态出现的概率称为期望概率,网络运行过程中网络各个状态实际出现的概率称为实际概率,两个概率之间的差值就是网络调整连接权值的基础。

自联想记忆的学习规则

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

互联想记忆的学习规则

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
下一章传送门:《人工神经网络原理》读书笔记(七)-自适应共振理论神经网络

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/159852.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Java基础面试题整理「建议收藏」

    面向对象的三个特征封装,继承,多态.这个应该是人人皆知.有时候也会加上抽象.多态的好处允许不同类对象对同一消息做出响应,即同一消息可以根据发送对象的不同而采用多种不同的行为方式(发送消息就是函数调用).主要有以下优点:可替换性:多态对已存在代码具有可替换性. 可扩充性:增加新的子类不影响已经存在的类结构. 接口性:多态是超类通过方法签名,向子类提供一个公共接口,由子类来完善或者…

    2022年4月10日
    34
  • Python之getopt模块

    Python之getopt模块第一步很简单,只需要: importgetopt,sys第二步处理方法如下(以Python手册上的例子为例): try:opts,args=getopt.getopt(sys.argv[1:],”ho:”,[“help”,”output=”])exceptgetopt.GetoptError:#printhelpinformati

    2022年6月11日
    28
  • 用MDK生成bin文件的步骤及方法

    用MDK生成bin文件的步骤及方法1用MDK生成bin文件Embest徐良平在RVMDK中,默认情况下生成*.hex的可执行文件,但是当我们要生成*.bin的可执行文件时怎么办呢?答案是可以使用RVCT的fromelf.exe工具进行转换。也就是说首先将源文件编译链接成*.axf的文件,然后使用fromelf.exe工具将*.axf格式的文件转换成*.bin格式的文件。下面将具体

    2022年10月20日
    0
  • vscode怎么html和php混编,vscode如何编译运行html文件[通俗易懂]

    vscode怎么html和php混编,vscode如何编译运行html文件[通俗易懂]首先打开我们的VSCode软件,然后新建一个HTML文件,注意,在VSCode软件里面新建一个文件,它的后缀名也必须写上这时候我们写好HTML内容之后,鼠标右键,发现没有运行HTML文件的按钮我们需要点击VSCode软件左边的“扩展”,或者同时按住键盘上的Ctrl+shift+I键进入“扩展”界面进入“扩展”界面之后,我们在搜索框内输入“open”,然后找到“openinbrowser…

    2022年8月21日
    6
  • 区块链体验的几点建议,CIC共识网络让保险操作更智能

    区块链体验的几点建议,CIC共识网络让保险操作更智能自从双持了iOS和Android之后,就开始了CIC共识网络App在不同平台的玩耍,使用了一段时间之后,掰扯掰扯下自己的使用体验。1、先说下邀请安装体验,邀请人分别网址邀请和二维码邀请,就CIC的邀请方式有2种,比较全面。但根据本人使用的多款区块链APP来看,目前CIC的邀请不论是网址邀请,还是二维码邀请,广告词内容和二维码界面基本没什么特色,只是平白的介绍而已。一是广告词缺乏吸引客户主动注册的文…

    2022年5月28日
    35
  • MySQL与PostgreSQL相比哪个更好?

    MySQL与PostgreSQL相比哪个更好?

    2022年2月7日
    162

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号