Boltzmann机详解

Boltzmann机详解基于热力学的随机型神经网络–Boltzmann机1.模拟退火算法我们知道,Hopfield神经网络拥有联想记忆的能力,这也是对生物神经网络的一种模拟。但是,Hopfield神经网络也和BP神经网络一样,有一个致命的缺陷:只能找到局部最优解,而无法沿着梯度上升的方向在全局的角度寻求全局最优解。为了解决这个问题,1983年,Kirkpatrick等提出了模拟退火算法(SA)能有效的解决局部最优…

大家好,又见面了,我是你们的朋友全栈君。

基于热力学的随机型神经网络–Boltzmann机

1. 模拟退火算法

我们知道,Hopfield神经网络拥有联想记忆的能力,这也是对生物神经网络的一种模拟。但是,Hopfield神经网络也和BP神经网络一样,有一个致命的缺陷:只能找到局部最优解,而无法沿着梯度上升的方向在全局的角度寻求全局最优解。
为了解决这个问题,1983年,Kirkpatrick等提出了模拟退火算法(SA)能有效的解决局部最优解问题。‘退火’是物理学术语,指对物体加温在冷却的过程。模拟退火算法来源于晶体冷却的过程,如果固体不处于最低能量状态,给固体加热再冷却,随着温度缓慢下降,固体中的原子按照一定形状排列,形成高密度、低能量的有规则晶体,对应于算法中的全局最优解。模拟退火算法包含两个部分即Metropolis算法和退火过程。Metropolis算法就是如何在局部最优解的情况下让其跳出来,是退火的基础。1953年Metropolis提出重要性采样方法,即以概率来接受新状态,而不是使用完全确定的规则,称为Metropolis准则,计算量较低。

在这里插入图片描述

如上图所示,为模拟退火算法的示意图,在梯度下降法中,算法只有“下坡”的能力,没有“爬坡”的能力。而模拟退火算法不仅具有“下坡”能力,还赋予其爬坡能力。

2. 玻尔兹曼分布

在热力学中,对于一个封闭的系统,温度越高,混乱程度就越高,当温度降低时,系统逐渐趋于热力学平衡状态。对应神经网络的最优解。

将模拟退火算法和玻尔兹曼分布同Hopfield神经网络结合起来,就可以得到一种基于概率的神经网络模型–Boltzmann机,其有以下特点:

  • 初始温度可以设置得较高,使其拥有足够的“爬坡”能力;
  • 在迭代的过程中,温度逐渐降低,知道最终趋于最小温度(即网络达到平衡状态)
  • 在迭代降低温度时,降低的速率应该足够慢,可以采用线性更替:T(n+1)=ηT(n),0.8<η<0.99。

在这里插入图片描述

3. Boltzmann机

3.1 Boltzmann机的结构

BM网络的拓扑结构比较特殊,介于DHNN网的全互连结构与BP网的层次结构之间。从形式上看,BM网络与单层反馈网络DHNN网相似,具有对称权值,即,且=0。但从神经元的功能上看,BM网络与三层BP网相似,具 有输人节点、隐节点和输节点称为可见节点,而将隐节点称为不可见节点。训练时输人输出节点接收训练集样本,而隐节点主要起辅助作用,用来实现输人与输出之间的联系,使训练集能在可见单元再现。BM网络的三类节点之间没有明显的层次,连接形式可用上图的有向图表示。

在这里插入图片描述

同Hopfield神经网络有所不同,Boltzmann机的节点分为可见节点与隐节点,这说明Boltzmann机的结构介于Hopfield神经网络和BP神经网络之间。它又分为两种类型:

  • 自联想型BM:输入节点与输出节点公用
  • 异联想型BM:可见节点分为输入节点和输出节点

无论哪种类型的BM,都有一个共同的特点:所有的节点全连接,整个网络构成一个无向图。

3.2 Boltzmann机的训练过程

通过有导师学习,BM网络可以对训练集中各模式的概率分布进行模拟,从而实现联想记忆.学习的目的是通过调整网络权值使训练集中的模式在网络状态中以相同的概率再现.学习过程可分为两个阶段;第一阶段称为正向学习阶段或输入期,即向网络输入一对输人输出模式,将网络输人输出节点的状态“钳制”到期望的状态,而让隐节点自由活动,以捕捉模式对之间的对应规律;第二阶段称为反向学习阶段或自由运行期,对于异联想学习,用输人模式“钳住”输人节点而让隐节点和输出节点自由活动,对于自联想学习,让可见节点和隐节点都自由活动,以体现网络对输人输出对应规律的模拟情况。输人输出的对应规律表现为网络达到热平衡时,相连节点状态同时为1的平均概率。期望对应规律与模拟对应规律之间的差别就表现为两个学习阶段所对应的平均概率的差值,此差值便作为权值调整的依据。设BM网络隐节点数为m,可见节点数为n,则可见节点可表达的状态X(对于异联想,X中部分分量代表输人模式,另一部分代表输出模式)共有2”种。设训练集提供了P对模式,一般有P<n,训练集用一组概率分布表示各模式对出现的概率:

  1. 网络热平衡状态

为了统计以上的概率,需要反复使BM网络按模拟退火算法运行并达到热平衡状态,具体如下:

1.1 在正向学习阶段,用一对训练模式钳住网络的可见节点;在反向学习阶段,用训练模式中的输入部分钳住可见节点中的输入节点。  
1.2 随机选择自由活动节点j,使其更新状态为  
1.3 计算节点j状态更新而引起的网络能量变化       
1.4 若则接受状态更新;当时接受新状态,否则维持原状态。是预先设置的数值,在模拟退火过程中,温度T随时间逐渐降低,根据(3)式的讨论情况a看 ,对于常数,为使 ,必须使即在训练中不断减小,因此网络的爬山能力也是减小的。  
1.5 所有自由节点全部选择一遍  
1.6 按事先选定的降温方式降温,退火算法的降温规律没有统一的定论,一般要求初始温度足够高,降温速度充分慢,以保证网络收敛到全局最小,我们在模拟退火算法中给出了两个,现在拿出来:  
1.7 返回步骤②~⑥直到对所有自由节点均有,此时认为网络已经达到热平衡状态,此状态可供学习算法中统计任意两个节点同时为1的概率使用。    
  1. 权值调整算法与步骤
    2.1 随机设定网络的初始权值
    2.2 正向学习阶段按已知概率向网络输入学习模式。在的约束下按上述模拟退火算法运行网络到热平衡状态,统计该状态下网络中任意两个节点i与j同时为1的概率.
    2.3 反向学习阶段在无约束条件下或者在仅输入节点有约束条件下的运行网络到热平衡状态,统计该状态下网络中任意两节点i与j同时为1的概率.
    2.4 权值调整算法为:
    2.5 重复以上的步骤直到与充分接近

总结

Boltzmann机是将模拟退火算法和玻尔兹曼分布结合到传统神经网络中构成的一种随机型神经网络模型。它基本解决了由梯度下降法带来的局部最优问题。但是,它也有很大的缺陷:由上述训练过程可以知道,Boltzmann机训练过程时分漫长,所以它在实际中运用的并不多。这促使着大家开始解决由这种Boltzmann机带来的问题,后来就提出了受限Bolzmman机模型。详见受限Boltamann机详解一文

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/158102.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • SPSS单因素方差分析教程「建议收藏」

    SPSS单因素方差分析教程「建议收藏」SPSS单因素方差分析,非正态分布的秩和检验

    2022年8月30日
    7
  • pi可以卸载重新安装吗_pip删除安装包

    pi可以卸载重新安装吗_pip删除安装包打开python安装目录下的Scripts文件夹,在空白处shift+鼠标右键,选择在此处打开命令窗口,在弹出的窗口中执行命令easy_install.exepip即可。如果python安装目录下的Scripts目录中有没有easy_install.exe参见http://blog.csdn.net/la6nf/article/details/7…

    2022年10月19日
    3
  • 在win7下安装VC6.0

    在win7下安装VC6.0

    2021年11月14日
    51
  • MySQL多表查询核心优化

    MySQL多表查询核心优化在一般的项目开发中,对数据表的多表查询是必不可少的。而对于存在大量数据量的情况时(例如百万级数据量),我们就需要从数据库的各个方面来进行优化,本文就先从多表查询开始。

    2022年6月2日
    39
  • strstr c语言函数实现,strstr函数实现(C语言)

    strstr c语言函数实现,strstr函数实现(C语言)strstr函数实现(C语言)second6020180601数组strstr用来字符串查找子串。数据结构顺便说一下,字符串操做函数是C语言中很是重要的函数,里面包括了指针的精华,同时对学习数据结构,如链表,数组,有很是好的练手方法。同时,知道内部实现,是基础中的基础。因此学习字符串操做函数是深刻学C的必经之路。函数#include#includeconstchar*strs…

    2022年6月25日
    32
  • java jar包与war包_jar包和war包的区别,java jar包和war包部署的区别介绍「建议收藏」

    java jar包与war包_jar包和war包的区别,java jar包和war包部署的区别介绍「建议收藏」很多人都在想jar和war部署究竟哪个好呢?jar包和war包这两者之间的区别又是怎样的?有着什么不同?带着这些问题下面就一起来了解一下吧。1、jar包和war包概念介绍最首先的话,我们还是要来对jar包以及war包的概念进行一个简单的了解,首先是jar包。什么是jar包?jar包是类的归档文件,jar文件格式以流行的ZIP文件格式作为基础,和ZIP文件不一样的是,JAR文件不仅仅用来进行压缩和发…

    2022年5月24日
    40

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号