堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)自动编码器(Auto-Encoder,AE)自编码器(autoencoder)是神经网络的一种,经过训练后能尝试将输入复制到输出。自编码器内部有一个隐藏层h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数h=f(x)表示的编码器和一个生成重构的解码器r=g(h)。我们不应该将自编码器设计成输入到输出完全相等。这通常需要向自编码器强加一些约束,使它只能近…

大家好,又见面了,我是你们的朋友全栈君。

原文链接

自动编码器(Auto-Encoder,AE)

自动编码器(Auto-Encoder,AE)自编码器(autoencoder)是神经网络的一种,经过训练后能尝试将输入复制到输出。自编码器内部有一个隐藏层 h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数 h = f(x) 表示的编码器和一个生成重构的解码器 r = g(h)。我们不应该将自编码器设计成输入到输出完全相等。这通常需要向自编码器强加一些约束,使它只能近似地复制,并只能复制与训练数据相似的输入。

自动编码机由三层网络组成,其中输入层神经元数量与输出层神经元数量相等,中间层神经元数量少于输入层和输出层。搭建一个自动编码器需要完成下面三样工作:搭建编码器,搭建解码器,设定一个损失函数,用以衡量由于压缩而损失掉的信息(自编码器是有损的)。编码器和解码器一般都是参数化的方程,并关于损失函数可导,典型情况是使用神经网络。编码器和解码器的参数可以通过最小化损失函数而优化。

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)

自动编码机(Auto-encoder)是一个自监督的算法,并不是一个无监督算法,它不需要对训练样本进行标记,其标签产生自输入数据。因此自编码器很容易对指定类的输入训练出一种特定的编码器,而不需要完成任何新工作。自动编码器是数据相关的,只能压缩那些与训练数据类似的数据。比如,使用人脸训练出来的自动编码器在压缩别的图片,比如树木时性能很差,因为它学习到的特征是与人脸相关的。

自动编码器运算过程:原始input(设为x)经过加权(W、b)、映射(Sigmoid)之后得到y,再对y反向加权映射回来成为z。通过反复迭代训练两组(W、b),目的就是使输出信号与输入信号尽量相似。训练结束之后自动编码器可以由两部分组成:

1.输入层和中间层,可以用这个网络来对信号进行压缩

2.中间层和输出层,我们可以将压缩的信号进行还原

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)

降噪自动编码器(Denoising Auto Encoder,DAE)

降噪自动编码器就是在自动编码器的基础之上,为了防止过拟合问题而对输入层的输入数据加入噪音,使学习得到的编码器具有鲁棒性而改进的,是Bengio在08年论文:Extracting and composing robust features with denoising autoencoders提出的。
论文中关于降噪自动编码器的示意图如下,类似于dropout,其中x是原始的输入数据,降噪自动编码器以一定概率(通常使用二项分布)把输入层节点的值置为0,从而得到含有噪音的模型输入xˆ。

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)

这个破损的数据是很有用的,原因有二: 
1.通过与非破损数据训练的对比,破损数据训练出来的Weight噪声比较小。降噪因此得名。原因不难理解,因为擦除的时候不小心把输入噪声给×掉了。 
2.破损数据一定程度上减轻了训练数据与测试数据的代沟。由于数据的部分被×掉了,因而这破损数据一定程度上比较接近测试数据。训练、测试肯定有同有异,当然我们要求同舍异。

堆叠降噪自动编码器(Stacked Denoising Auto Encoder,SDAE)

SDAE的思想就是将多个DAE堆叠在一起形成一个深度的架构。只有在训练的时候才会对输入进行腐蚀(加噪),训练完成就不需要在进行腐蚀。结构如下图所示:

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)

逐层贪婪训练:每层自编码层都单独进行非监督训练,以最小化输入(输入为前一层的隐层输出)与重构结果之间的误差为训练目标。前K层训练好了,就可以训练K+1层,因为已经前向传播求出K层的输出,再用K层的输出当作K+1的输入训练K+1层。

一旦SDAE训练完成, 其高层的特征就可以用做传统的监督算法的输入。当然,也可以在最顶层添加一层logistic regression layer(softmax层),然后使用带label的数据来进一步对网络进行微调(fine-tuning),即用样本进行有监督训练。

  1. 预测阶段:根据状态转移方程,每一个粒子得到一个预测粒子;

  2. 校正阶段:对预测粒子进行评价,越接近于真实状态的粒子,其权重越大;

  3. 重采样:根据粒子权重对粒子进行筛选,筛选过程中,既要大量保留权重大的粒子,又要有一小部分权重小的粒子;

  4. 滤波:将重采样后的粒子带入状态转移方程得到新的预测粒子,即步骤2。

学习更多编程知识,请关注我的公众号:

代码的路

堆叠降噪自动编码器 Stacked Denoising Auto Encoder(SDAE)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142807.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月22日 下午10:00
下一篇 2022年5月22日 下午10:00


相关推荐

  • python正则表达式入门

    python正则表达式入门今天我们来学习 python 的正则表达式的部分 先说下为什么要学习这一部分呢 当然是因为正则表达式处理文本类型的数据实在是太方便了 为以后进入 nlp 领域打打基础 先给大家推荐一个网站 用于正则表达式验证 大致就长这个样子 这里写目录标题 1 基础知识 2 贪婪模式和非贪婪模式 3 反斜杠的用途 4 中括号的用法 5 匹配启始和结束位置 6 括号的用法 组选择 7 正则表达式切割字符总结 1 基础知识普通字符 普通字符的含义就是字节匹配他们 特殊字符 它们出现在正则表达式中 不是直接匹配他们 而是

    2026年3月19日
    2
  • 大一java实训报告1500字_java实训报告总结范文

    大一java实训报告1500字_java实训报告总结范文1java 实训报告总结范文 WORD 文档 下载后可编辑修改下面是小编收集整理的范本 欢迎您借鉴参考阅读和下载 侵删 您的努力学习是为了更美好的未来 java 实训报告范文一一 实训目的 1 熟练掌握 Java 面向对象程序设计的基础知识 2 熟练掌握 Java 中常用的 Swing 组件的使用方法 3 熟练掌握 Java 程序中图形用户界面设计的方法 4 熟练掌握使用 JDBC 操作数据库的方法 5 通过实

    2026年3月17日
    2
  • Windows和Linux下查看Apache、MySQL、PHP版本

    Windows和Linux下查看Apache、MySQL、PHP版本

    2021年10月8日
    77
  • QTreeView使用总结13,自定义model示例,大大优化性能和内存[通俗易懂]

    QTreeView使用总结13,自定义model示例,大大优化性能和内存[通俗易懂]1,简介前面简单介绍过Qt的模型/视图框架,提到了Qt预定义的几个model类型:QStringListModel:存储简单的字符串列表QStandardItemModel:可以用于树结构的存储,提供了层次数据QFileSystemModel:本地系统的文件和目录信息QSqlQueryModel、QSqlTableModel、QSqlRelati…

    2022年5月29日
    43
  • navicat premium激活码_在线激活

    (navicat premium激活码)2021最新分享一个能用的的激活码出来,希望能帮到需要激活的朋友。目前这个是能用的,但是用的人多了之后也会失效,会不定时更新的,大家持续关注此网站~https://javaforall.net/100143.htmlIntelliJ2021最新激活注册码,破解教程可免费永久激活,亲测有效,上面是详细链接哦~08…

    2022年3月28日
    37
  • c语言将时速转换成配速,配速与时速换算(跑步配速和时速换算)

    c语言将时速转换成配速,配速与时速换算(跑步配速和时速换算)时间除以路程,一般时间单位用分,路程单位用千米。比如20分钟跑了3千米,那配速就是20/3=6.66,也就是6分40秒每公里,一般说成640的配速。配速是针对长跑来说的,对短跑和中跑是不采用这个概念的。马拉松运动讲究匀速,在匀速的状态下才能更好地发挥自己的实力。很多跑步爱好者很注意控制速度。他们根.时速的意思是当时跑步的速度,配速是平均每公里耗时几分钟消耗是指跑步消耗的热量相当于每小时跑多少千…

    2022年6月28日
    69

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号