卷积操作的参数量和FLOPs

卷积操作的参数量和FLOPs卷积操作的参数量和FLOPs  这里首先需要辨析一个概念就是FLOPs和FLOPS可以看到简写的差别仅仅是一个字母大小写的区别。  FLOPS(floating-pointoperationspersecond),这个缩写长这个样子确实也很奇怪,大致概念就是指每秒浮点数运算次数,最后一个S是秒(second)的缩写,是计组中的概念,用来描述计算机的运算速度。  FLOPs(floati…

大家好,又见面了,我是你们的朋友全栈君。

卷积操作的参数量和FLOPs

  这里首先需要辨析一个概念就是FLOPs和FLOPS可以看到简写的差别仅仅是一个字母大小写的区别。
  FLOPS(floating-point operations per second),这个缩写长这个样子确实也很奇怪,大致概念就是指每秒浮点数运算次数,最后一个S是秒(second)的缩写,是计组中的概念,用来描述计算机的运算速度。
  FLOPs(floating-point operations),一旦s变为小写,就表示复数的概念,就是浮点数运算次数,这就和计算量相关了,和卷积或者其他算法联系起来基本上就表示计算次数,可用来衡量操作的复杂程度。
  卷积的参数基本上都是说的卷积核的参数,拿一层神经网络来看,卷积核的大小是 ( k h , k w ) (k_h,k_w) (kh,kw),显然一个卷积核的参数量是这个卷积核的矩阵 k h ∗ k w k_h*k_w khkw,通常这里还要加上一个偏置 b b b,算作一个参数,为了简便计算,这里忽略不计,通常b的设置会有差异性。如果说一层神经网络的输入通道数为 C i n C_{in} Cin输出通道数为 C o u t C_{out} Cout,卷积核需要通过矩阵运算,把输入的 C i n C_{in} Cin的通道数映射为输出为 C o u t C_{out} Cout,如果熟悉卷积核矩阵乘法,我们显然知道这个卷积核的参数就是 C i n ∗ k h ∗ k w ∗ C o u t C_{in}*k_h*k_w*C_{out} CinkhkwCout,而且需要注意这只是一个卷积核的,如果有多个卷积核的还需要乘数量。
  假设我们经过这个卷积,将输入的特征图映射为 ( H , W ) (H,W) (H,W)的特征图,特征图这些部分是我们中间的计算结果,我们不需要当参数保存,所以计算参数不需要包括这部分。但是如果算卷积操作的计算量,则就用得到了。我们通过对一个区域的卷积运算,将这个区域映射为特征图中的一个cell,同样我们想矩阵的乘法,把一个矩阵乘以 { C i n , k h , k w } \left \{ C_{in},k_h,k_w \right \} {
Cinkhkw}
的卷积核变为一个1乘1的矩阵,可以理解为内积操作,所以得到这一个cell的计算量就是这么多个元素的矩阵的内积操作,显然这个计算量就是 C i n ∗ k h ∗ k w C_{in}*k_h*k_w Cinkhkw个乘法加 C i n ∗ k h ∗ k w C_{in}*k_h*k_w Cinkhkw-1个加法。但是显然我们输出的通道数是 C o u t C_{out} Cout,所以我们需要 C o u t C_{out} Cout个这样的操作。这只是求出来一个输出特征图的cell,我们需要求 H ∗ W H*W HW个cell,那么最终的计算量还需要再乘上这个值。也就是 ( 2 C i n ∗ k h ∗ k w − 1 ) ∗ C o u t ∗ H ∗ W \left(2C_{in}*k_h*k_w-1\right)*C_{out}*H*W (2Cinkhkw1)CoutHW的计算量了。
  如果有偏置常数的话,显然这个偏置常数只关系加法,而且是在内积求完之后的,所以相当于加法也变为了 C i n ∗ k h ∗ k w C_{in}*k_h*k_w Cinkhkw个,没有那个-1,然后这样算出的最终计算量就是 ( 2 C i n ∗ k h ∗ k w ) ∗ C o u t ∗ H ∗ W \left(2C_{in}*k_h*k_w\right)*C_{out}*H*W (2Cinkhkw)CoutHW
  一个cell一个cell的计算卷积,我们可以参考一张解释卷积的图。
在这里插入图片描述
  衡量计算量除了FLOPs外还有一种概念是求MACs(Multiply Accumulate)乘积累加运算次数,一次乘积,然后把这个乘积和另外一个数求和就叫一次MAC,显然与上面计算结果的关系就在于是否要乘2的关系。
  如果在本文中,发现了作者的一些错误,请及时指出,感激不尽。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/140488.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 分布式系统中CAP原理[通俗易懂]

    分布式系统中CAP原理[通俗易懂]分布式系统CAP原理分布式系统发开虽然有点很多但是并不是完美的,CAP原理就是其中的体现之一。CAP原理:指的是在一个分布式系统中,Consistency(一致性)、Availability(可用性)、Partitontolerance(分区容忍性),三者不可得兼。一致性(C):在分布式系统中的所有数据备份,在同一时刻是否同样的值。简单说就是所有节点在同一时刻的数据完全一致,这就意味着节点越…

    2022年5月19日
    37
  • MySQL和SQLyog安装配置教程

    MySQL和SQLyog安装配置教程文章目录1.MySQL和配套SQLyog压缩包2.MySQL的安装配置3.SQLyog(小海豚)安装4.最后成功样子5.前期练习可能会需要的脚本需要的可以下载:1.MySQL和配套SQLyog压缩包 百度网盘资源链接:链接:https://pan.baidu.com/s/15r2rmmfzFV8oB5DgdbgwiQ 提取码:3s5u2.MySQL的安装配置可参考文章1.解压压缩包后:复制bin文件的路径2.以管理员身份打开命令提示符进入刚复制的bin文件目录然后按步骤安装MyS

    2022年5月28日
    71
  • bitr函数的用法_average函数怎么用

    bitr函数的用法_average函数怎么用BitBlt函数用法  2010-03-0510:25:51|  分类: VC学习|举报|字号 订阅      下载LOFTER我的照片书  |(一)BOOLBitBlt(intx,inty,intnWidth,intnHe

    2022年10月19日
    0
  • ESLint-的基本介绍[通俗易懂]

    ESLint-的基本介绍[通俗易懂]什么是eslintESLint是一个代码检查工具,用来检查你的代码是否符合指定的规范(例如:=的前后必须有一个空格)。规范行业推荐的规范;在创建项目时,我们使用的是JavaScriptStandardStyle代码风格的规则自定义的规范。你和你的团队可以自行约定一套规范使用ESLint的好处在于:多人协作时代码风格统一eslint是法官,Standard是法律vue-cli工具在创建项目时提供选项,我们前面在创建项目时选中了它,所以它在本项目中是直接生效

    2022年6月18日
    32
  • Microsoft Enterprise Library: Logging 模块「建议收藏」

    Microsoft Enterprise Library: Logging 模块「建议收藏」MicrosoftEnterpriseLibrary中的Logging模块主要用来记录日志,它可以将日志存储在不同的介质中:文本文件,WindowsEvent,邮件,MSMQ,DataBase,Xml等等。当然它还提供了扩展功能,通过扩展Logging模块的Listener类,我们就能将日志记录在我们需要的地方了。   虽然MicrosoftEnterpriseLibrary很庞大,但

    2022年10月20日
    0
  • 运放电流检测采样电路电压采样电路

    运放电流检测采样电路电压采样电路输入输出电压检测输入输出电压通过运放LMC6482采用差分电路将输出电压按比例缩小至ADC能够采样的范围,再使用ADC采样,软件解算出输出电压。输入电压采样是通过MCU内部运放按比例缩小在送到ADC进行采样的,具体电路如图3.5.1所示。输出电压检测电路如图3.4.1所示。输出电流检测➢输出电流检测电路通过运放LMC6482采样差分放大电路实现;采样电阻放在低端,若采样电阻放在高端,会有较大的共模电压使采样电流不准确,采样电阻为10m????,由于采样电阻较小,采样电阻上的压降较小,不利于直

    2022年6月2日
    234

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号