lstm分类模型_模型有哪两种

lstm分类模型_模型有哪两种介绍LSTM模型在语言模型,机器翻译等领域取得了非凡的成就,然后LSTM网络有几百万的参数以及需要数周在多GPU系统中进行训练。因此,一下介绍两种方法来缩减网络参数以及训练时间。两种方法分别为factorizedLSTM(FLSTM)以及groupLSTM(GLSTM)。FLSTMFLSTM网络主要是将大的LSTM矩阵转化为两个小的矩阵。LSTM模型简单介绍在LST…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

#介绍
LSTM模型在语言模型,机器翻译等领域取得了非凡的成就,然后LSTM网络有几百万的参数以及需要数周在多GPU系统中进行训练。因此,一下介绍两种方法来缩减网络参数以及训练时间。两种方法分别为factorized LSTM(FLSTM)以及group LSTM(GLSTM)。
#FLSTM
FLSTM网络主要是将大的LSTM矩阵转化为两个小的矩阵。
##LSTM模型简单介绍
在LSTM网络中,
这里写图片描述
其中 x t x_t xt表示输入, h t h_t ht表示cell state, c t c_t ct表示cell memory。
令cell gates(i,f,o,g)可以计算为:
这里写图片描述
其中 x t ∈ R p , h t ∈ R p . a n d T : R 2 p → R 4 n x_t \in R^p,h_t \in R^p.and T:R^{2p} \rightarrow R^{4n} xtRp,htRp.andT:R2pR4n是一个仿射变换 T = W ∗ [ x t , h t − 1 ] + b T = W * [x_t,h_{t-1}] + b T=W[xt,ht1]+b,则 h t ∈ R p , c t ∈ R n 可 以 用 下 面 的 等 式 计 算 h_t \in R^p,c_t \in R^n 可以用下面的等式计算 htRp,ctRn
这里写图片描述
其中, P : R n → R p P : R^n \rightarrow R^p P:RnRp是一个线性的映射,这里主要的计算量是在仿射变换T,由于其涉及到4n2p的矩阵W,因此,FLSTM网络主要减少W的参数。
##优化方法
在FLSTM网络中,主要是将矩阵W转化为两个矩阵,可以近似为 W ≈ W 2 ∗ W 1 W \approx W_2 * W_1 WW2W1,其中 W 1 W_1 W1大小为2p
r,$ W_2KaTeX parse error: Expected ‘EOF’, got ‘#’ at position 258: …=/dissolve/70) #̲GLSTM GLSTM主要是将…x_t 以 及 隐 藏 层 以及隐藏层 h_t 可 以 被 分 到 不 同 的 独 立 的 组 中 。 例 如 , 如 果 有 两 个 组 , 则 可以被分到不同的独立的组中。例如,如果有两个组,则 x_t 和 和 h_t 能 够 有 效 的 被 分 成 两 个 向 量 , 能够有效的被分成两个向量, x_t = (x_t1,x_t2) 和 和 h_t = (h_t1,h_t2) , 其 中 ,其中 h_ti$仅依靠$x_ti,h_{t-1}^i$以及cell memory state。因此,分为k个组的公式可以表示为:
这里写图片描述

其中, T j T^j Tj是组j的从 R 2 p / k 到 R 4 n / k R^{2p/k} 到 R^{4n/k} R2p/kR4n/k的放射变换,组T有 k ∗ 4 n ∗ 2 p k ∗ k k*\frac{4n*2p}{k*k} kkk4n2p个参数,这种结构适合并行计算,因为每个组的计算都是独立的。具体结构如图1所示。
#实验结果

这里写图片描述

这里写图片描述

#源码
https://github.com/okuchaiev/f-lm

参考文献:
factorization tricks for lstm networks

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/195389.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • android系统签名及修改

    android系统签名及修改系统签名文件目录:build/make/target/product/security主要签名文件media.pk8media.x509.pemnetworkstack.pk8networkstack.x509.pemplatform.pk8platform.x509.pemreleasekey.pk8releasekey.x509.pemshared.pk8shared.x509.pemtestkey.pk8testkey.x509.p…

    2022年6月21日
    165
  • 基于stm32的室内环境监测系统设计及实现_毕业设计怎么做

    基于stm32的室内环境监测系统设计及实现_毕业设计怎么做一、前言这是本科时的毕业设计,想着之后读研了,研究方向是机器学习了,可能不会这么再碰32或者51之类的板子了,就想趁着还没有忘记就来梳理一下,纪念陪伴了我两年的硬件朋友们,作为的一个足迹。二、项目背景及资源分享这次毕业设计的灵感来源于20年的电赛,当时因为考研时间紧张的原因,在做一个《无线传感器结点》题目的时候,当时是使用的无线传感器模块讲数据传到电脑作为一个上位机的展示。但当时想做的是使用wifi模块来实现无线传输功能,传到一个自己写的web服务器,在页面上进行展示的,由于时间原因最终还是选择了前者

    2022年9月1日
    4
  • Codeforces 451E Devu and Flowers(容斥原理)

    Codeforces 451E Devu and Flowers(容斥原理)

    2022年1月12日
    46
  • WebRTC 系列文章 ICE服务器搭建 coturn[通俗易懂]

    WebRTC 系列文章 ICE服务器搭建 coturn[通俗易懂]WebRTC系列文章ICE服务器搭建服务器环境安装coturn安装coturn依赖软件克隆代码仓库安装coturn修改配置克隆一份配置文件修改配置项启动coturn检测coturn工作状态coturn是一个C++编写的开源ICE服务器,同时兼顾了STUN和TURN的功能。服务器环境CentOS7云服务器一台安装coturn安装coturn依赖软件yumi…

    2022年6月13日
    101
  • H2内存数据库的函数「建议收藏」

    每个数据库为了使用者的查询简便性以及使用效率,都有专门提供一些函数给使用者进行使用,H2也同样如此,虽然没有oracle那么多强大的函数,但是一般需求的使用还是能够满足,下面就简单介绍下都有哪些函数一、函数的分类以及名称1、聚合函数(AggregateFunctions) AVGBOOL_ANDBOOL_ORCOUNTGROUP_CONCAT MAXMIN…

    2022年4月15日
    37
  • ws 无法热替换的问题

    ws 无法热替换的问题

    2022年2月23日
    38

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号