3DCNN论文阅读

3DCNN论文阅读3DCNN应用范围:视频动作识别、医疗图像诊断、高光谱图像(HSI)分类等

大家好,又见面了,我是你们的朋友全栈君。

3DCNN应用范围:视频分类和动作识别、医疗图像诊断、高光谱图像(HSI)分类等

1. 视频分类和动作识别

1.1《Learning Spatiotemporal Features with 3D Convolutional Networks》

2015年CVPR

这篇论文应该是3DCNN的鼻祖,对于视频数据来说,作者认为3D ConvNet非常适合于时空特征学习,这里也就是视频分析任务上。
摘要:
我们提出了一种简单而有效的时空特征学习方法,该方法使用在大规模有监督视频数据集上训练的深层三维卷积网络(3D ConvNets)。我们的发现有三个方面:1)与2D ConvNet相比,3D ConvNet更适合时空特征学习;2)具有小的3×3×3卷积核的同质结构是3D ConvNet中性能最好的结构之一;3)我们学习的特征,即C3D(卷积3D),在4个不同的基准上优于最先进的方法,并在其他2个基准上与当前最好的方法相媲美。此外,特征紧凑:在只有10维的UCF101数据集上达到了52.8%的准确率,而且由于ConvNets的快速推理,计算效率也很高。最后,它们在概念上非常简单,易于培训和使用。

3D卷积与2D卷积的区别:
在这里插入图片描述
对于视频分析任务而言,3D卷积核与2D卷积核相比,其多了时间维度的卷积:
2DCNN的卷积核大小是[C,W,H],
3DCNN的卷积核大小是[T,C,W,H],
C是卷积核通道数,W是卷积核的宽,H是卷积核的高,T是时间长度。
在这里插入图片描述上图来源

C3D的网络结构:
在这里插入图片描述

C3D的不足之处:
输入图像分辨率较低,该网络结构较浅,参数数量过多。

1.2 《A novel micro-expression detection algorithm based on BERT and 3DCNN》

中科院三区:Image and Vision Computing
这篇是用在微表情检测上的。
在这里插入图片描述

1.3 《Hand Gesture Recognition for Sign Language Using 3DCNN》

中科院三区:IEEE Access

摘要:
最近,由于两个主要原因,自动手势识别变得越来越重要:聋人和听力受损人口的增长,以及基于视觉的应用程序和无处不在的设备上的非接触式控制的发展。由于手势识别是手语分析的核心,因此强大的手势识别系统应同时考虑空间和时间特征。不幸的是,为手势序列找到有区别的时空描述符并不是一项简单的任务。在这项研究中,我们提出了一种有效的深度卷积神经网络方法来进行手势识别。所提出的方法采用迁移学习来克服大型标记手势数据集的稀缺性。我们使用来自彩色视频的三个手势数据集对其进行了评估:这些数据集中使用了 40、23 和 10 个类别。对于签名者依赖模式,该方法在三个数据集上分别获得了 98.12%、100% 和 76.67% 的识别率。对于签名者无关模式,它在三个数据集上分别获得了 84.38%、34.9% 和 70% 的识别率。

单个基于 3DCNN 的结构:
在这里插入图片描述
输入是16张图片。

融合并行3DCNN结构:

在这里插入图片描述
输入是32张图片,分成了前16张,中间的16张,和最后的16张输入并行3DCNN结构中,最后全连接层融合,这里相邻的输入图像有50%的重叠。

2. 医疗图像诊断

2.1《3D U-Net: Learning Dense Volumetric Segmentation from Sparse Annotation》

3D U-Net原理与U-Net差不多,就是2D卷积核变成了3D卷积核。U-Net主要就是用来做医疗图像分割的。

U-Net和3D U-Net如下图:

在这里插入图片描述

在这里插入图片描述

3. 高光谱图像分类

3.1 《Multiscale Feature Fusion Network Incorporating 3D Self-Attention for Hyperspectral Image Classification》

中科院二区:remote sensing

摘要:
近年来,基于深度学习的高光谱图像(HSI)分类方法取得了巨大成功,卷积神经网络(CNN)方法在HSI分类任务中取得了良好的分类性能。然而,卷积操作仅适用于局部邻域,并且在提取局部特征方面是有效的。长距离的交互特征难以捕捉,在一定程度上影响了分类的准确性。同时,来自 HSI的数据具有三维、冗余和噪声的特点。 为了解决这些问题,我们提出了一种集成了 3D 多头自注意力的 3D自注意力多尺度特征融合网络(3DSA-MFN)。 3DSA-MFN首先使用不同大小的卷积核提取多尺度特征,对特征图的不同粒度进行采样,有效融合特征图的空间和光谱特征。然后,我们提出了一种改进的 3D 多头自注意力机制,为自注意力分支提供局部特征细节,并充分利用输入矩阵的上下文。为了验证所提出方法的性能,我们将其与三个公共数据集上的六种当前方法进行了比较。实验结果表明,所提出的3DSA-MFN实现了有竞争力的分类并突出了HSI分类任务。
在这里插入图片描述
3DSA-MFN 网络框架。该方法通过降维和窗口裁剪对原始数据进行预处理,然后将处理后的数据发送到多尺度特征融合、3DCOV_attention等模块进行特征提取,最后在多个全连接层上输出分类结果。

3.2 《Multiple Spectral Resolution 3D Convolutional Neural Network for Hyperspectral Image Classification》

中科院二区:remote sensing

摘要:
近年来,得益于深度学习技术在计算机视觉领域的快速发展,高光谱图像(HSI)分类的研究也取得了长足的进步。但是,与普通的 RGB 图像相比,HSI 更像是 3D 立方体;因此,探索适合 HSI 非常特殊的数据结构的分类方法是必要和有益的。在本文中,我们提出了用于 HSI 分类任务的多光谱分辨率 3D 卷积神经网络 (MSR-3DCNN)。在MSR-3DCNN中,我们将多尺度特征融合和空洞卷积的思想从空间维度扩展到光谱维度,将3D卷积和残差连接结合起来;因此,它可以更好地适应高光谱数据的3D立方形式,并有效利用不同波段的光谱信息。四个基准数据集的实验结果表明,与一些最先进的 (SOTA) HSI 分类方法相比,该方法的有效性及其优越性。
在这里插入图片描述

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/136461.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • opencv学习笔记之对灰度图像遍历的三种方法

    opencv学习笔记之对灰度图像遍历的三种方法灰度图像遍历的三种方法通过指针访问 通过迭代器访问 动态地址计算,通过at()函数实现、实现代码:#include#includeusingnamespacecv;usingnamespacestd;intmain(){ MatImg=imread(“1.jpg”,0); if(!Img.data){cout<

    2022年5月7日
    137
  • 如何通俗的理解函数的极限_不理解函数极限的定义![通俗易懂]

    如何通俗的理解函数的极限_不理解函数极限的定义![通俗易懂]极限定义里,为什么用“存在”“任意”“不等式”的数学语言来定义极限?怎样将普通语…楼主的问题显然是有备而来,是经过严格逻辑分析后有感而发的问题。确确实实,我们的高数教师,在教极限时,其实他们的大多数,也只是跟着和尚就念经,跟着道士就画符。解释来解释去就是那么死板板的几句话,连他们自己也没有makesense,教师如此,教科书如此,学生也只能以葫芦画瓢,难以彻底理解。下面尝试一下,看看能不…

    2022年5月22日
    35
  • 调用网站第三方接口实现短信发邮件「建议收藏」

    调用网站第三方接口实现短信发邮件「建议收藏」一,电子邮件的使用在项目开发中,经常会用到通过程序发送电子邮件,例如:注册用户邮件激活,通过邮件找回密码,发送报表等。二,通过PHP程序来操作电子邮件几种通过PHP发送电子邮件的方式1)通过mail()函数发送邮件2)使用fsockopen方式连接smtp服务器发送3)使用phpmailer邮件类发送。个人推荐使用phpmailer邮件类发送,phpmailer比较方便而且功能强大…

    2022年6月3日
    74
  • uCOSII操作系统移植笔记

    uCOSII操作系统移植笔记笔记一:今天粗略的看了一下周立功关于uc/osII在lpc2104上的移植方面的说明,这之中印象最深的应该是irq中断和软中断方面的处理,由于arm芯片的特殊性(拥有7种处理器模式),即每种处理器模式都有自己的堆栈,这样在处理堆栈的时候就会相应的麻烦一些。在响应异常时,该移植计划在初始代码里面比在没有操作系统的初始代码多了irq的处理,移植里面的irq处理多了由汇编语言编写的对任务环境的保存,

    2022年6月3日
    33
  • matlab怎么定义矩阵函数,MATLAB数组的常用函数

    3进行数组运算的常用函数在MATLAB中有一些常用函数,这些函数在日常的编程计算过程中会经常遇到,一般是基本的数学概念在MATLAB中的函数表达方式。这些函数在MATLAB中可以同时作用于整个矩阵或者数组,应用起来非常方便,不需要再另写循环程序来对各元素分别进行计算。掌握这些函数是进一步学习的基础。MATLAB人性化的地方在于其自带函数基本是按照相对应的英文名称缩写而来,所以便于记忆。3.1…

    2022年4月8日
    85
  • pycharm如何远程连接服务器_py服务端软件

    pycharm如何远程连接服务器_py服务端软件通过pycharm远程连接服务器首先确定你连接服务器的方式软件准备验证软件是否安装成功pycharm远程连接服务器上传自己的project到Ubuntu上传完以后,开始给自己的项目配置服务器的python解释器如何使用路由器,开启外网映射通过路由器的底部的网址进入管理员页面选择应用管理进入虚拟服务器在虚拟服务器中添加需要把内网映射到外网的IP地址查看自己映射出去的外网IP地址至此大功告成!!!您可以通过外网来访问您学校的服务器啦!首先确定你连接服务器的方式一般连接服务器需要服务器的ip地址,IP地址分为

    2022年8月28日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号