3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition「建议收藏」

3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition「建议收藏」3DCNN参数解析:2013-PAMI-3DCNNforHumanActionRecognition参数分析Input:7@60×\times×40,7帧,图片大小60×\times×40hardwired:H1产生5通道信息,分别是gray,gradient-x,gradient-y,optflow-x,optflow-y。前三个对于每一张图片都计算得…

大家好,又见面了,我是你们的朋友全栈君。

3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition


3DCNN框架图

参数分析
Input:7 @ 60 × \times × 40, 7帧,图片大小60 × \times × 40

hardwired: H1
产生5通道信息,分别是gray, gradient-x, gradient-y, optflow-x, optflow-y。前三个对于每一张图片都计算得到一张图,后两个是相邻两张图片得到一张图。
因此,经过hardwired可以得到:7 × \times × 3 + 6 × \times × 2 = 33
经过hardwired可以得到33 @ 60 × \times × 40

3DCNN layer:C2
对于前面的5个通道,每个通道都用2个kernel size: 7 × \times × 7 × \times × 3 (7 × \times × 7是spatial dimension, 3是temporal dimension)的3D卷积(padding=0, stride=1)
((7-3+1) × \times × 3 + (6-3+1) × \times × 2) × \times × 2 = 23 × \times × 2 (5个通道分别有[5,5,5,4,4]个)
输出大小是:(60-7+1)/1 = 54; (40-7+1)/1 = 34
因此,经过C2可以得到 23 × \times × 2 @ 54 × \times × 34
C2的参数量:5 × \times × 2 × \times × (7 × \times × 7 × \times × 3+1)= 1480

Subsampling layer: S3
用2 × \times × 2的subsampling
输出:23 × \times × 2@27 × \times × 17
参数量:23 × \times × 2 × \times × 2=92

3DCNN layer:C4
对于前面的5个通道(5个通道分别有[5,5,5,4,4]个feature maps),每个通道都用2个kernel size: 7 × \times × 6 × \times × 3 (7 × \times × 6是spatial dimension, 3是temporal dimension)的3D卷积(padding=0, stride=1),每个位置用了3个conv
((5-3+1) × \times × 3 + (4-3+1) × \times × 2 ) × \times × 2 × \times × 3 = 13 × \times × 6 (5个通道分别有[3,3,3,2,2]个)
输出大小是:(27-7+1)/1=21;(17-6+1)/1=12
因此,经过C4可以得到 13 × \times × 6 @ 21 × \times × 12
C2的参数量:5 × \times × 6 × \times × (7 × \times × 6 × \times × 3+1)=3810

Subsampling layer: S5
用3 × \times × 3的subsampling
输出:13 × \times × 6 @7 × \times × 4
参数量:13 × \times × 6 × \times × 2=156

CNN layer:C6
kernel size: 7 × \times × 4,num output = 128 (每个都和前面S5的78个feature map连接)
因此,经过C6可以得到 128 @ 1 × \times × 1
C6的参数量:128 × \times × 78 × \times × (7 × \times × 4+1)= 289536

最后一层:
输出3 classes, 全连接
参数量:3 × \times × 128 = 384

综上,整个网络的参数量是1480 + 92 + 3810 + 156 + 289536 + 384 = 295458

喜欢请打赏,一毛两毛也是个意思,么么哒
支F宝账号:2363891614@qq.com
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132268.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • ubuntu14.04下gcc版本查看以及多版本gcc管理与切换整理

    ubuntu14.04下gcc版本查看以及多版本gcc管理与切换整理一:GCC版本查看:版本查看:gcc–versiong++–version位置查看:whichgccwhichg++二:GCC多版本管理与切换:参考这篇博客:https://blog.csdn.net/menghuanbeike/article/details/79008640三:gcc4.8.5安装教程:参考这篇博客:https://ww…

    2022年6月26日
    27
  • python实现求和,求平均值——函数[通俗易懂]

    python实现求和,求平均值——函数[通俗易懂]#求三个数的和defsum(a,b,c):returna+b+cx=int(input("请输入第一个数:"))y=int(input("请输入第二个数:&

    2022年7月5日
    31
  • 海量数据挖掘MMDS week3:社交网络之社区检测:基本技巧「建议收藏」

    http://blog.csdn.net/pipisorry/article/details/49052057海量数据挖掘MiningMassiveDatasets(MMDs)-JureLeskovec courses学习笔记之社交网络之社区检测:基本技巧-生成模型及其参数的梯度上升方法求解博客内容:社区检测的基本技巧部分,覆盖”overlappingcommunities”寻找最好集合

    2022年4月13日
    114
  • hive的存储类型_4.2数据类型

    hive的存储类型_4.2数据类型了解Hive数据类型,是Hive编程的基础。使用hive建表,首先要明白hive常用的数据类型有哪些,可以存储哪些类型的数据。其实Hive支持关系型数据库中的大多数基本数据类型,且同时支持关系型数据库中少见的3种集合数类型(STRUCT,MAP,ARRAY)。然而学习技术最好的方式之一就是去查看官方文档。Hive关于数据类型官网地址:Hive官网关于数据类型的介绍…

    2022年9月21日
    0
  • ACM之Java输入输出[通俗易懂]

    ACM之Java输入输出[通俗易懂]一、Java之ACM注意点1. 类名称必须采用public class Main方式命名2. 在有些OJ系统上,即便是输出的末尾多了一个“ ”,程序可能会输出错误,所以在我看来好多OJ系统做的是非常之垃圾3. 有些OJ上的题目会直接将OI上的题目拷贝过来,所以即便是题目中有输入和输出文件,可能也不需要,因为在OJ系统中一般是采用标准输入输出,不需要文件4. 在有多行数据输入的情况下

    2022年5月9日
    164
  • 流式布局 简单_CSS3流式布局

    流式布局 简单_CSS3流式布局第三方库://依赖:compile’com.hyman:flowlayout-lib:1.1.2’布局文件<com.zhy.view.flowlayout.TagFlowLayoutandroid:id="@+id/id_flowlayout"zhy:max_select="-1"android:layout

    2025年7月7日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号