3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition「建议收藏」

3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition「建议收藏」3DCNN参数解析:2013-PAMI-3DCNNforHumanActionRecognition参数分析Input:7@60×\times×40,7帧,图片大小60×\times×40hardwired:H1产生5通道信息,分别是gray,gradient-x,gradient-y,optflow-x,optflow-y。前三个对于每一张图片都计算得…

大家好,又见面了,我是你们的朋友全栈君。

3DCNN参数解析:2013-PAMI-3DCNN for Human Action Recognition


3DCNN框架图

参数分析
Input:7 @ 60 × \times × 40, 7帧,图片大小60 × \times × 40

hardwired: H1
产生5通道信息,分别是gray, gradient-x, gradient-y, optflow-x, optflow-y。前三个对于每一张图片都计算得到一张图,后两个是相邻两张图片得到一张图。
因此,经过hardwired可以得到:7 × \times × 3 + 6 × \times × 2 = 33
经过hardwired可以得到33 @ 60 × \times × 40

3DCNN layer:C2
对于前面的5个通道,每个通道都用2个kernel size: 7 × \times × 7 × \times × 3 (7 × \times × 7是spatial dimension, 3是temporal dimension)的3D卷积(padding=0, stride=1)
((7-3+1) × \times × 3 + (6-3+1) × \times × 2) × \times × 2 = 23 × \times × 2 (5个通道分别有[5,5,5,4,4]个)
输出大小是:(60-7+1)/1 = 54; (40-7+1)/1 = 34
因此,经过C2可以得到 23 × \times × 2 @ 54 × \times × 34
C2的参数量:5 × \times × 2 × \times × (7 × \times × 7 × \times × 3+1)= 1480

Subsampling layer: S3
用2 × \times × 2的subsampling
输出:23 × \times × 2@27 × \times × 17
参数量:23 × \times × 2 × \times × 2=92

3DCNN layer:C4
对于前面的5个通道(5个通道分别有[5,5,5,4,4]个feature maps),每个通道都用2个kernel size: 7 × \times × 6 × \times × 3 (7 × \times × 6是spatial dimension, 3是temporal dimension)的3D卷积(padding=0, stride=1),每个位置用了3个conv
((5-3+1) × \times × 3 + (4-3+1) × \times × 2 ) × \times × 2 × \times × 3 = 13 × \times × 6 (5个通道分别有[3,3,3,2,2]个)
输出大小是:(27-7+1)/1=21;(17-6+1)/1=12
因此,经过C4可以得到 13 × \times × 6 @ 21 × \times × 12
C2的参数量:5 × \times × 6 × \times × (7 × \times × 6 × \times × 3+1)=3810

Subsampling layer: S5
用3 × \times × 3的subsampling
输出:13 × \times × 6 @7 × \times × 4
参数量:13 × \times × 6 × \times × 2=156

CNN layer:C6
kernel size: 7 × \times × 4,num output = 128 (每个都和前面S5的78个feature map连接)
因此,经过C6可以得到 128 @ 1 × \times × 1
C6的参数量:128 × \times × 78 × \times × (7 × \times × 4+1)= 289536

最后一层:
输出3 classes, 全连接
参数量:3 × \times × 128 = 384

综上,整个网络的参数量是1480 + 92 + 3810 + 156 + 289536 + 384 = 295458

喜欢请打赏,一毛两毛也是个意思,么么哒
支F宝账号:2363891614@qq.com
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132268.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 卡商卡盟在线批发平台_卡盟总控源码

    卡商卡盟在线批发平台_卡盟总控源码源码介绍:该源码对接宝塔API实现秒搭建主站功能,包括分站开通等都无需人工操作源码价值:****.**¥我也不知道值多少钱,反正修了很久才对接好宝塔接口跟各种问题,搞了好多天,时间长达3个月,不过不是连续修2个月,反正开始搞到现在搞了3个月多吧没有接好支付通道,想要运营的可以找我对接或者找别人对接安装说明服务器系统:Linux+Centos7.x+宝塔亲测环境:Nginx1.1…

    2022年8月12日
    4
  • FlashFXP 3.6 Final(正式版)注册码

    FlashFXP 3.6 Final(正式版)注册码昨天登陆FTP提示是否要升级,也没有注意点了下同意,结果升级后是最新英文版本的,把原来的资料也给丢了,忙了半天一看原来的注册码已经不好使用,在网上搜索下,找到一个可以使用的注册码和大家分享下:———————————————————FLASHFXPxgA9UrTnxgAAAAC7W5MNJwTnsl73n0Vuu1AePJgEAG41mgSvHSiDWi1Kg8B5xJNCCCAVCMr9R

    2022年7月26日
    14
  • Admin组件

    Django提供了admin组件为项目提供基本的管理后台功能(对数据表的增删改查)。本篇文章通过对admin源码简单分析admin内部原理,扩展使用方式,为以后进行定制和自己开发组件做铺垫

    2022年3月29日
    37
  • Django(55)GenericAPIView源码分析

    Django(55)GenericAPIView源码分析源码分析GenericAPIView继承自APIView,也就是在APIView基础上再做了一层封装,源码如下:classGenericAPIView(views.APIView):query

    2022年7月29日
    6
  • 字符串匹配之KMP—全力解析

    字符串匹配之KMP—全力解析

    2021年11月29日
    41
  • matlab的三维绘图和四维绘图「建议收藏」

    matlab的三维绘图和四维绘图「建议收藏」一、三维绘图1.曲线图plot3(X1,Y1,Z1,…):以默认线性属性绘制三维点集(X1,Y1,Z1)确定的曲线 plot3(X1,Y1,Z1,LineSpec):以参数LineSpec确定的线性属性绘制三维点集 plot3(X1,Y1,Z1,’PropertyName’,PropertyValue,…):根据指定的属性绘制三维曲线theta=0:0.01*pi:2*…

    2022年10月11日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号