RNN简介

RNN简介1 RNN 的应用 nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp RNN 主要有两个应用 一是评测一个句子出现的可能性 二是文本自动生成 2 什么是 RNN nbsp nbsp nbsp nbsp nbsp nbsp nbsp nbsp RNN 之所以叫 RNN 是因为它循环处理相同的任务 就是预测句子接下来的单词是什么 RNN 认为在这循环的任务中 各个步骤之间不是独立 于是它循环记录前面所有文本的信息 也叫记忆 作为预测当前词的一个输入 nbsp nbsp nbsp 在 RNN 中 每个词作为一层

1.RNN的应用

         RNN主要有两个应用,一是评测一个句子出现的可能性,二是文本自动生成。

2.什么是RNN?

         RNN之所以叫RNN是因为它循环处理相同的任务,就是预测句子接下来的单词是什么。RNN认为在这循环的任务中,各个步骤之间不是独立,于是它循环记录前面所有文本的信息(也叫记忆),作为预测当前词的一个输入。

   RNN简介

在RNN中,每个词作为一层,对其进行预测。

RNN简介

RNN简介

F函数一般是tanh或者ReLU

RNN简介是在t时刻词典中所有词出现的概率,也就是|RNN简介|=|vocabulary|

并且所有层共享U和W

 

3.RNN用来做什么?

         RNNs在NLP中得到了巨大的成功,LSTM是被广泛使用的RNN。LSTM与典型的RNN基本框架一致,只是使用了不同的方式来计算隐藏状态。

         3.1语言模型和文本生成

                  语言模型中,输入时经过编码的词向量序列,输出是一系列预测的词。在训练模型的时候,令 RNN简介,也就是让输出等于下一时刻真实的输入,因为在文本生成中,这一时刻的输出对应的是下一时刻的输入。

         3.2机器翻译

                  机器翻译与语言模型的不同是,机器翻译必须等待所有输入结束后才输出,因为这个时候才能得到翻译句子的所有信息。

         RNN简介

         3.3语音识别。

                  输入一系列的声波信息,然后预测一段语音。

         3.4生成图像描述

                  RNNs和 CNN一起,可以用来为未标记的图像生成描述。

4. 训练RNNs

         训练RNN和训练传统的神经网络一样,都是使用反向传播算法,但是又有些不同,这里所有步骤都共享同一个参数,每一个步骤的回归输出不仅仅依赖于当前时刻,还依赖前面时刻的步骤,这就叫BPTT算法(时间反向传播)。

5. RNN拓展

         5.1双向RNN

                  双向RNN的基本思路基于当前状态下的输出不仅与前面序列有关,还与后面的序列有关。比如要预测序列的一个词,不仅要看左边的词,还要看右边的词。

          RNN简介

         5.2 深度(双向)RNN

深度(双向)RNN和双向RNN一样,只不过是每一步的隐藏层更多,这使得我们可以获得一个更加好的效果。

                 RNN简介

         5.3 LSTM

                  LSTM与传统RNN相比,使用了不同方式了计算隐藏状态,它的输入是前一状态的隐藏状态和当前状态的输入,并通过一个输入门和忘记门来对输入进行优化。

 

LSTM和GRU都是计算隐藏态的黑盒。

 

6. LSTM

        RNN简介

        RNN简介

            RNN简介

               

 

7.GRU

              RNN简介

           RNN简介

 

推荐网址:    http://deeplearning.net/tutorial/lstm.html

   https://www.zybuluo.com/hanxiaoyang/note/

   http://blog.csdn.net/a/article/details/

   http://www.cnblogs.com/ZJUT-jiangnan/p/5222939.html

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/176786.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月26日 下午9:03
下一篇 2026年3月26日 下午9:03


相关推荐

  • 微信自动回复机器人含源码和安装包[通俗易懂]

    微信自动回复机器人含源码和安装包[通俗易懂]介绍微信自动回复机器人,有三个机器人可供选择,可在界面进行配置,可定时提醒,bs端程序,基于C#winfrom程序安装教程源码地址:https://gitee.com/xiaoyutou_647/wechat-auto-reply-robot/blob/master/README.md直接打开\Setup1\setup.exe即可安装需要安装的环境已经集成使用说明1.点击启动微信2.扫码登陆3.运行成功4.5.根据最前面的id开启自动恢复功能6.也可进行语音唤醒,一起

    2022年10月1日
    6
  • 什么是ER图?数据库ER图基础概念整理

    什么是ER图?数据库ER图基础概念整理前置知识概述:数据模型的基本概念模型就是对现实世界特征的模拟和抽象,数据模型是对现实世界数据特征的抽象。对于具体的模型人们并不陌生,如航模飞机、地图和建筑设计沙盘等都是具体的模型。最常用的数据模型分为概念数据模型和基本数据模型。1)概念数据模型概念数据模型也称为信息模型,是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象,强调其语义表达功能,易于用户理解,是用户和数据库设计人员交流的语言,主要用于数据库设计。这类模型中最著名的是实体联系模型,简称E-R模型。2)基本数据

    2022年6月21日
    46
  • Mac Tensorflow Pycharm安装

    Mac Tensorflow Pycharm安装Python3.6,PyCharm2020.3.3anaconda旧版本下载地址及与python各版本对应关系anaconda旧版本下载地址及与python各版本对应关系_heivy的博客-CSDN博客_anaconda旧版本anaconda老版本下载的方法anaconda老版本下载的方法_weixin_33759269的博客-CSDN博客安装参考:基于mac系统的TensorFlow安装以及pycharm配置-简书参考上述链接安装完毕后:…

    2022年8月26日
    6
  • 保姆级教程:6步用DeepSeek搭建本地知识库(附完整代码)

    保姆级教程:6步用DeepSeek搭建本地知识库(附完整代码)

    2026年3月16日
    1
  • selenium+webdriver_python爬虫安装

    selenium+webdriver_python爬虫安装1、下载地址:https://chromedriver.chromium.org/downloads根据谷歌浏览器的版本选择地址,一定要选择对应的版本,选择错误无法运行程序。如果找不到对应的版本,可以把谷歌浏览器更新到最新的版本,然后下载页面第一个程序(最新)2、安装步骤①将下载到的文件解压,应当只有一个EXE文件②将该文件拷贝一份放到谷歌浏览器目录下,找到快捷方式【打开所在目录】即可③将该文件再拷贝一份放到Python编译器目录下如图2所示。图1将文件放到谷歌浏览器目录下图2将文

    2026年1月23日
    6
  • onbeforeunload事件_pageload事件何时触发

    onbeforeunload事件_pageload事件何时触发beforeunload事件简介当窗口,文档及其资源即将卸载时,将触发该事件。该文档仍然可见,此时事件仍可取消。如果为returnValueEvent属性分配了一个字符串,则会出现一个对话框,要求用户确认离开该页面(参见下面的示例)。IE浏览器在对话框中显示返回的字符串,但其他浏览器会显示自己的消息。如果未提供任何值,则以静默方式处理事件。注意:为了防止不需要…

    2025年8月16日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号