Boltzmann机详解

Boltzmann机详解基于热力学的随机型神经网络–Boltzmann机1.模拟退火算法我们知道,Hopfield神经网络拥有联想记忆的能力,这也是对生物神经网络的一种模拟。但是,Hopfield神经网络也和BP神经网络一样,有一个致命的缺陷:只能找到局部最优解,而无法沿着梯度上升的方向在全局的角度寻求全局最优解。为了解决这个问题,1983年,Kirkpatrick等提出了模拟退火算法(SA)能有效的解决局部最优…

大家好,又见面了,我是你们的朋友全栈君。

基于热力学的随机型神经网络–Boltzmann机

1. 模拟退火算法

我们知道,Hopfield神经网络拥有联想记忆的能力,这也是对生物神经网络的一种模拟。但是,Hopfield神经网络也和BP神经网络一样,有一个致命的缺陷:只能找到局部最优解,而无法沿着梯度上升的方向在全局的角度寻求全局最优解。
为了解决这个问题,1983年,Kirkpatrick等提出了模拟退火算法(SA)能有效的解决局部最优解问题。‘退火’是物理学术语,指对物体加温在冷却的过程。模拟退火算法来源于晶体冷却的过程,如果固体不处于最低能量状态,给固体加热再冷却,随着温度缓慢下降,固体中的原子按照一定形状排列,形成高密度、低能量的有规则晶体,对应于算法中的全局最优解。模拟退火算法包含两个部分即Metropolis算法和退火过程。Metropolis算法就是如何在局部最优解的情况下让其跳出来,是退火的基础。1953年Metropolis提出重要性采样方法,即以概率来接受新状态,而不是使用完全确定的规则,称为Metropolis准则,计算量较低。

在这里插入图片描述

如上图所示,为模拟退火算法的示意图,在梯度下降法中,算法只有“下坡”的能力,没有“爬坡”的能力。而模拟退火算法不仅具有“下坡”能力,还赋予其爬坡能力。

2. 玻尔兹曼分布

在热力学中,对于一个封闭的系统,温度越高,混乱程度就越高,当温度降低时,系统逐渐趋于热力学平衡状态。对应神经网络的最优解。

将模拟退火算法和玻尔兹曼分布同Hopfield神经网络结合起来,就可以得到一种基于概率的神经网络模型–Boltzmann机,其有以下特点:

  • 初始温度可以设置得较高,使其拥有足够的“爬坡”能力;
  • 在迭代的过程中,温度逐渐降低,知道最终趋于最小温度(即网络达到平衡状态)
  • 在迭代降低温度时,降低的速率应该足够慢,可以采用线性更替:T(n+1)=ηT(n),0.8<η<0.99。

在这里插入图片描述

3. Boltzmann机

3.1 Boltzmann机的结构

BM网络的拓扑结构比较特殊,介于DHNN网的全互连结构与BP网的层次结构之间。从形式上看,BM网络与单层反馈网络DHNN网相似,具有对称权值,即,且=0。但从神经元的功能上看,BM网络与三层BP网相似,具 有输人节点、隐节点和输节点称为可见节点,而将隐节点称为不可见节点。训练时输人输出节点接收训练集样本,而隐节点主要起辅助作用,用来实现输人与输出之间的联系,使训练集能在可见单元再现。BM网络的三类节点之间没有明显的层次,连接形式可用上图的有向图表示。

在这里插入图片描述

同Hopfield神经网络有所不同,Boltzmann机的节点分为可见节点与隐节点,这说明Boltzmann机的结构介于Hopfield神经网络和BP神经网络之间。它又分为两种类型:

  • 自联想型BM:输入节点与输出节点公用
  • 异联想型BM:可见节点分为输入节点和输出节点

无论哪种类型的BM,都有一个共同的特点:所有的节点全连接,整个网络构成一个无向图。

3.2 Boltzmann机的训练过程

通过有导师学习,BM网络可以对训练集中各模式的概率分布进行模拟,从而实现联想记忆.学习的目的是通过调整网络权值使训练集中的模式在网络状态中以相同的概率再现.学习过程可分为两个阶段;第一阶段称为正向学习阶段或输入期,即向网络输入一对输人输出模式,将网络输人输出节点的状态“钳制”到期望的状态,而让隐节点自由活动,以捕捉模式对之间的对应规律;第二阶段称为反向学习阶段或自由运行期,对于异联想学习,用输人模式“钳住”输人节点而让隐节点和输出节点自由活动,对于自联想学习,让可见节点和隐节点都自由活动,以体现网络对输人输出对应规律的模拟情况。输人输出的对应规律表现为网络达到热平衡时,相连节点状态同时为1的平均概率。期望对应规律与模拟对应规律之间的差别就表现为两个学习阶段所对应的平均概率的差值,此差值便作为权值调整的依据。设BM网络隐节点数为m,可见节点数为n,则可见节点可表达的状态X(对于异联想,X中部分分量代表输人模式,另一部分代表输出模式)共有2”种。设训练集提供了P对模式,一般有P<n,训练集用一组概率分布表示各模式对出现的概率:

  1. 网络热平衡状态

为了统计以上的概率,需要反复使BM网络按模拟退火算法运行并达到热平衡状态,具体如下:

1.1 在正向学习阶段,用一对训练模式钳住网络的可见节点;在反向学习阶段,用训练模式中的输入部分钳住可见节点中的输入节点。  
1.2 随机选择自由活动节点j,使其更新状态为  
1.3 计算节点j状态更新而引起的网络能量变化       
1.4 若则接受状态更新;当时接受新状态,否则维持原状态。是预先设置的数值,在模拟退火过程中,温度T随时间逐渐降低,根据(3)式的讨论情况a看 ,对于常数,为使 ,必须使即在训练中不断减小,因此网络的爬山能力也是减小的。  
1.5 所有自由节点全部选择一遍  
1.6 按事先选定的降温方式降温,退火算法的降温规律没有统一的定论,一般要求初始温度足够高,降温速度充分慢,以保证网络收敛到全局最小,我们在模拟退火算法中给出了两个,现在拿出来:  
1.7 返回步骤②~⑥直到对所有自由节点均有,此时认为网络已经达到热平衡状态,此状态可供学习算法中统计任意两个节点同时为1的概率使用。    
  1. 权值调整算法与步骤
    2.1 随机设定网络的初始权值
    2.2 正向学习阶段按已知概率向网络输入学习模式。在的约束下按上述模拟退火算法运行网络到热平衡状态,统计该状态下网络中任意两个节点i与j同时为1的概率.
    2.3 反向学习阶段在无约束条件下或者在仅输入节点有约束条件下的运行网络到热平衡状态,统计该状态下网络中任意两节点i与j同时为1的概率.
    2.4 权值调整算法为:
    2.5 重复以上的步骤直到与充分接近

总结

Boltzmann机是将模拟退火算法和玻尔兹曼分布结合到传统神经网络中构成的一种随机型神经网络模型。它基本解决了由梯度下降法带来的局部最优问题。但是,它也有很大的缺陷:由上述训练过程可以知道,Boltzmann机训练过程时分漫长,所以它在实际中运用的并不多。这促使着大家开始解决由这种Boltzmann机带来的问题,后来就提出了受限Bolzmman机模型。详见受限Boltamann机详解一文

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/158102.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • centos7 安装nginx 完整步骤「建议收藏」

    centos7 安装nginx 完整步骤「建议收藏」1.安装gccgcc是用来编译下载下来的nginx源码 yuminstallgcc-c++2、安装pcre和pcre-devel  PCRE(PerlCompatibleRegularExpressions)是一个Perl库,包括perl兼容的正则表达式库。nginx的http模块使用pcre来解析正则表达式,pcre-devel是使用pcre开…

    2022年4月29日
    92
  • 大数据处理的基本流程是什么?[通俗易懂]

    写在前面本文隶属于专栏《100个问题搞定大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和文献引用请见100个问题搞定大数据理论体系解答大数据处理流程主要分为3步:1.数据抽取和集成2.数据分析3.数据解释补充1.数据抽取与集成由于大数据处理的数据来源类型丰富,利用多个数据库来接收来自客户端的数据,包括企业内部数据库、互联网数据和物联网数据,所以需要从数据中提取关系和实体,经过关联和聚合等操作,按照统一定义的格式对数据

    2022年4月9日
    78
  • goland2022.01.4激活【最新永久激活】2022.01.17

    (goland2022.01.4激活)这是一篇idea技术相关文章,由全栈君为大家提供,主要知识点是关于2021JetBrains全家桶永久激活码的内容IntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,下面是详细链接哦~https://javaforall.net/100143.html0HKLM1UCCY-eyJsaWN…

    2022年3月31日
    187
  • Oracle常用操作

    Oracle常用操作

    2021年9月3日
    53
  • java databus_linkedin 的 databus 部署「建议收藏」

    java databus_linkedin 的 databus 部署「建议收藏」1.下载源码复制ojdbc.jar到相应的文件夹gitclonehttps://github.com/linkedin/databus/sandbox-repo/com/oracle/ojdbc6/11.2.0.2.0/ojdbc6-11.2.0.2.0.jar2.在subprojects.gradle中加上options.addStringOption(‘encodi…

    2022年10月17日
    2
  • STM32项目设计:基于STM32F4的电子阅读器制作教程[通俗易懂]

    STM32项目设计:基于STM32F4的电子阅读器制作教程[通俗易懂]基于STM32F4的电子阅读器一、项目功能要求项目说明:项目偏软件,但是要依赖于自己对硬件的熟悉和驱动才能完成用到的主要技术:SD卡驱动(难–不过可移植SD卡驱动细节可在用完再了解其驱动协议)FatFs文件系统移植使用LCD屏驱动(加载字库文件做字库在LCD上的显示)功能要求:开机Logo电子书列表扫描电子书列表显示及小说选择菜单阅读功能:字体选择字体大小选择字体颜色设置阅读背景设置书签设置能够记录每本电子书的退出时处于什么阅读位置下

    2022年9月27日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号