Boltzmann机详解

Boltzmann机详解基于热力学的随机型神经网络–Boltzmann机1.模拟退火算法我们知道,Hopfield神经网络拥有联想记忆的能力,这也是对生物神经网络的一种模拟。但是,Hopfield神经网络也和BP神经网络一样,有一个致命的缺陷:只能找到局部最优解,而无法沿着梯度上升的方向在全局的角度寻求全局最优解。为了解决这个问题,1983年,Kirkpatrick等提出了模拟退火算法(SA)能有效的解决局部最优…

大家好,又见面了,我是你们的朋友全栈君。

基于热力学的随机型神经网络–Boltzmann机

1. 模拟退火算法

我们知道,Hopfield神经网络拥有联想记忆的能力,这也是对生物神经网络的一种模拟。但是,Hopfield神经网络也和BP神经网络一样,有一个致命的缺陷:只能找到局部最优解,而无法沿着梯度上升的方向在全局的角度寻求全局最优解。
为了解决这个问题,1983年,Kirkpatrick等提出了模拟退火算法(SA)能有效的解决局部最优解问题。‘退火’是物理学术语,指对物体加温在冷却的过程。模拟退火算法来源于晶体冷却的过程,如果固体不处于最低能量状态,给固体加热再冷却,随着温度缓慢下降,固体中的原子按照一定形状排列,形成高密度、低能量的有规则晶体,对应于算法中的全局最优解。模拟退火算法包含两个部分即Metropolis算法和退火过程。Metropolis算法就是如何在局部最优解的情况下让其跳出来,是退火的基础。1953年Metropolis提出重要性采样方法,即以概率来接受新状态,而不是使用完全确定的规则,称为Metropolis准则,计算量较低。

在这里插入图片描述

如上图所示,为模拟退火算法的示意图,在梯度下降法中,算法只有“下坡”的能力,没有“爬坡”的能力。而模拟退火算法不仅具有“下坡”能力,还赋予其爬坡能力。

2. 玻尔兹曼分布

在热力学中,对于一个封闭的系统,温度越高,混乱程度就越高,当温度降低时,系统逐渐趋于热力学平衡状态。对应神经网络的最优解。

将模拟退火算法和玻尔兹曼分布同Hopfield神经网络结合起来,就可以得到一种基于概率的神经网络模型–Boltzmann机,其有以下特点:

  • 初始温度可以设置得较高,使其拥有足够的“爬坡”能力;
  • 在迭代的过程中,温度逐渐降低,知道最终趋于最小温度(即网络达到平衡状态)
  • 在迭代降低温度时,降低的速率应该足够慢,可以采用线性更替:T(n+1)=ηT(n),0.8<η<0.99。

在这里插入图片描述

3. Boltzmann机

3.1 Boltzmann机的结构

BM网络的拓扑结构比较特殊,介于DHNN网的全互连结构与BP网的层次结构之间。从形式上看,BM网络与单层反馈网络DHNN网相似,具有对称权值,即,且=0。但从神经元的功能上看,BM网络与三层BP网相似,具 有输人节点、隐节点和输节点称为可见节点,而将隐节点称为不可见节点。训练时输人输出节点接收训练集样本,而隐节点主要起辅助作用,用来实现输人与输出之间的联系,使训练集能在可见单元再现。BM网络的三类节点之间没有明显的层次,连接形式可用上图的有向图表示。

在这里插入图片描述

同Hopfield神经网络有所不同,Boltzmann机的节点分为可见节点与隐节点,这说明Boltzmann机的结构介于Hopfield神经网络和BP神经网络之间。它又分为两种类型:

  • 自联想型BM:输入节点与输出节点公用
  • 异联想型BM:可见节点分为输入节点和输出节点

无论哪种类型的BM,都有一个共同的特点:所有的节点全连接,整个网络构成一个无向图。

3.2 Boltzmann机的训练过程

通过有导师学习,BM网络可以对训练集中各模式的概率分布进行模拟,从而实现联想记忆.学习的目的是通过调整网络权值使训练集中的模式在网络状态中以相同的概率再现.学习过程可分为两个阶段;第一阶段称为正向学习阶段或输入期,即向网络输入一对输人输出模式,将网络输人输出节点的状态“钳制”到期望的状态,而让隐节点自由活动,以捕捉模式对之间的对应规律;第二阶段称为反向学习阶段或自由运行期,对于异联想学习,用输人模式“钳住”输人节点而让隐节点和输出节点自由活动,对于自联想学习,让可见节点和隐节点都自由活动,以体现网络对输人输出对应规律的模拟情况。输人输出的对应规律表现为网络达到热平衡时,相连节点状态同时为1的平均概率。期望对应规律与模拟对应规律之间的差别就表现为两个学习阶段所对应的平均概率的差值,此差值便作为权值调整的依据。设BM网络隐节点数为m,可见节点数为n,则可见节点可表达的状态X(对于异联想,X中部分分量代表输人模式,另一部分代表输出模式)共有2”种。设训练集提供了P对模式,一般有P<n,训练集用一组概率分布表示各模式对出现的概率:

  1. 网络热平衡状态

为了统计以上的概率,需要反复使BM网络按模拟退火算法运行并达到热平衡状态,具体如下:

1.1 在正向学习阶段,用一对训练模式钳住网络的可见节点;在反向学习阶段,用训练模式中的输入部分钳住可见节点中的输入节点。  
1.2 随机选择自由活动节点j,使其更新状态为  
1.3 计算节点j状态更新而引起的网络能量变化       
1.4 若则接受状态更新;当时接受新状态,否则维持原状态。是预先设置的数值,在模拟退火过程中,温度T随时间逐渐降低,根据(3)式的讨论情况a看 ,对于常数,为使 ,必须使即在训练中不断减小,因此网络的爬山能力也是减小的。  
1.5 所有自由节点全部选择一遍  
1.6 按事先选定的降温方式降温,退火算法的降温规律没有统一的定论,一般要求初始温度足够高,降温速度充分慢,以保证网络收敛到全局最小,我们在模拟退火算法中给出了两个,现在拿出来:  
1.7 返回步骤②~⑥直到对所有自由节点均有,此时认为网络已经达到热平衡状态,此状态可供学习算法中统计任意两个节点同时为1的概率使用。    
  1. 权值调整算法与步骤
    2.1 随机设定网络的初始权值
    2.2 正向学习阶段按已知概率向网络输入学习模式。在的约束下按上述模拟退火算法运行网络到热平衡状态,统计该状态下网络中任意两个节点i与j同时为1的概率.
    2.3 反向学习阶段在无约束条件下或者在仅输入节点有约束条件下的运行网络到热平衡状态,统计该状态下网络中任意两节点i与j同时为1的概率.
    2.4 权值调整算法为:
    2.5 重复以上的步骤直到与充分接近

总结

Boltzmann机是将模拟退火算法和玻尔兹曼分布结合到传统神经网络中构成的一种随机型神经网络模型。它基本解决了由梯度下降法带来的局部最优问题。但是,它也有很大的缺陷:由上述训练过程可以知道,Boltzmann机训练过程时分漫长,所以它在实际中运用的并不多。这促使着大家开始解决由这种Boltzmann机带来的问题,后来就提出了受限Bolzmman机模型。详见受限Boltamann机详解一文

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/158102.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • JVM调优工具总结「建议收藏」

    JVM调优工具总结「建议收藏」一、jps:虚拟机进程状况工具它可以列出正在运行的虚拟机进程,并显示虚拟机执行主类(MainClass,main()函数所在的类)名称以及正在运行的本地虚拟机唯一ID(LVMID);它是使用率最高的一个JDK命令行工具,因为其他的命令行工具都需要输入查询到的ID来确定要监控的是哪一个虚拟机进程。命令格式:jps[options][hostid]选项作用-q只…

    2022年5月6日
    28
  • matlab函数plot函数_动态变量

    matlab函数plot函数_动态变量引子对于真实系统或者仿真平台,数据是增量式的产生的。Matlab除了强大的矩阵运算外,还具有强大的数据可视化库。由于静态画图的方法较多,本文只针对增量式数据流的动态显示。本文主要介绍几种Matlab实现数据的动态显示方法。方法主要有两种:holdonset函数与drawnow函数组合holdon方法1.方法介绍此种方法比较原始,适合于即时数据,原理是先画上一帧,接着保留原始图像,

    2022年10月10日
    2
  • Jlink或者stlink用于SWD接口下载程序

    Jlink或者stlink用于SWD接口下载程序最近要使用stm32f103c8t6最小系统板,直接ISP串口下载程序太麻烦,就想着使用swd接口来调试。结果:通过SWD接口下载程序成功,但调试失败,还不知原因,会的的人麻烦交流一下。SWD接口:3.3VDIO(数据)CLK(时钟)GND1.首先声明jlink和stlink都有jtag和swd调试功能。jlink接口如下:如图,我使用的就是VCC…

    2022年4月25日
    56
  • Docker Nginx SSL证书认证启动教程[通俗易懂]

    前言:linux环境下,ssl证书认证https,docker快速部署nginx1下载nginxdocker镜像准备:服务器首先要安装docker,docker安装教程网上很多域名、ssl证书dockerpullnginx:latest2新建文件夹mkdir-p/home/docker-nginx/conf.d/mkdir-p/home/docker-nginx/logmkdir-p/home/docker-nginx/3下载nginx.

    2022年4月16日
    81
  • lspci 安装_ipswme下载的系统如何安装

    lspci 安装_ipswme下载的系统如何安装在原版的busy-box做出来的文件系统中,lspci命令只有两个选项:ynq>lspci-hlspci:invalidoption–‘h’BusyBoxv1.20.1(2012-11-2713:37:12MST)multi-callbinary.Usage:lspci[-mk]ListallPCIdevices-m

    2025年10月17日
    4
  • sit、qas、dev、pet「建议收藏」

    sit、qas、dev、pet「建议收藏」SIT:SystemIntegrateTest系统整合测试QAS:QualityAssurancesystem质量保证DEV:Development开发PET:PerformanceEvaluationTest性能测试

    2022年6月28日
    35

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号