视频识别的基础概念[通俗易懂]

视频识别的基础概念[通俗易懂]视频识别一、视频识别几大问题2、常见的解决方案iDTTwo-StreamTSNC3DTDDRNNRPAN一、视频识别几大问题未修剪视频分类(UntrimmedVideoClassification):通过对输入的长视频进行全局分析,然后软分类到多个类别修剪视频识别(TrimmedActionRecognition):给出一段只包含一个动作的修剪视频,要求给视频分类时序行为提名(TemporalActionProposal):从长视频中找出可能含有动作的视频段时序行为定位(Tempor

大家好,又见面了,我是你们的朋友全栈君。

一、视频识别几大问题

  1. 未修剪视频分类(Untrimmed Video Classification):通过对输入的长视频进行全局分析,然后软分类到多个类别
  2. 修剪视频识别(Trimmed Action Recognition):给出一段只包含一个动作的修剪视频,要求给视频分类
  3. 时序行为提名(Temporal Action Proposal):从长视频中找出可能含有动作的视频段
  4. 时序行为定位(Temporal Action Localization):从视频中找到可能存在行为的视频段,并且给视频段分类
  5. 密集行为描述(Dense-Captioning Events):将一段未修剪的视频进行时序行为定位得到许多包含行为的视频段后,对该视频段进行行为描述

2、常见的解决方案

iDT

iDT算法框架主要包括:密集采样特征点,特征轨迹跟踪和基于轨迹的特征提取三个部分。
光流:在时间间隔很小的情况下,视频像素位移
特征提取:通过网格划分的方式在多尺度图像中分别密集采样特征点。通过计算特征点临域内的光流中值得到特征点运动方向。
在这里插入图片描述

编码:使用了HOF,HOG和MBH三种特征描述光流
HOG:灰度图像梯度直方图,HOG特征的长度为2238=96。
在这里插入图片描述
HOF:光流的直方图,8+1个bin,前8个和HOG相同,1是用于统计光流幅度小于某个阈值的像素。HOG特征的长度为2
239=108。
MBH:光流梯度直方图,在光流图像上计算HOG。光流图像包括x和y方向,所以MBH总的特征长度为2*96=192。

最后进行特征的归一化,DT算法中对HOG,HOF和MBH均使用L2范数进行归一化。

分类器:SVM

对于多分类:
评价指标:mAP、0-1 exact match、Macro-F1等
训练方法:
1)one hot encoding
用一系列的特征去拟合词汇,降低训练所需要的数据量。
2)CNN+RNN(CNN+LSTM)

Two-Stream

一部分处理RGB,一部分处理光流,最后联合训练再分类。
在这里插入图片描述

TSN

这是在Two-Stream上的改进,Two-Stream最大的问题是不能对长时间的视频进行建模,只能对连续几帧视频提取。TSN先将视频分成K个部分,然后从每个部分中随机的选出一个短的片段,然后对这个片段应用上述的two-stream方法,最后对于多个片段上提取到的特征做一个融合。下图是网络的结构图。
在这里插入图片描述

C3D

这个算法比Two-Stream精度低,但是快。网络结构更加简单。视频是三维,可以使用三维卷积核。
在这里插入图片描述

TDD

TDD特征结合了传统方法的轨迹跟踪和深度学习方法的卷积特征提取。
在这里插入图片描述

RNN

通过RNN可以处理序列问题。

RPAN

分为三大部分

  • 特征生成部分:用Two-Stream的方法生成
  • 姿态注意机制
  • LSTM时序处理网络

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130621.html原文链接:https://javaforall.net

(0)
上一篇 2022年4月29日 上午9:32
下一篇 2022年4月29日 上午9:32


相关推荐

  • oracle补位函数 不足位数补0[通俗易懂]

    oracle补位函数 不足位数补0[通俗易懂]不足位数补位的函数:1.左补位函数LPAD(原始字符,填充后长度,填充字符)2.右补位函数RPAD(原始字符,填充后长度,填充字符)如运行selectlpad(‘123’,6,0)col1fromdual;结果selectrpad(‘123’,6,0)col1fromdual;结果…

    2025年9月21日
    9
  • SqlServer存储过程详解

    SqlServer存储过程详解看到别人总结的 SQLserver 的存储过程觉得写的很好 就拿过来了 希望对大家有帮助 1 创建存储过程的基本语法模板 if exists select fromsys objectswhere pro name dropprocpro namegocreate name param nameparam t

    2026年3月26日
    2
  • java创建线程池代码_java手写线程池

    java创建线程池代码_java手写线程池oracle提供了一个通过ThreadPoolExecutor创建一个线程池的类构造器使用给定的参数和默认的饱和策略、默认的工厂方法创建线程池ThreadPoolExecutor(intcorePoolSize,intmaximumPoolSize,longkeepAliveTime,TimeUnitunit,BlockingQueue<Runna…

    2022年9月30日
    6
  • sql is not null 优化(oracle语句索引优化)

    oracle优化:ISNULL的优化优化方法:通过nvl(字段i,j),将字段i中为空的数据转化为j,从而将条件iisnull转化为j=nvl(i,j);转化isnull在所用oracle版本提升明显,注意:使用时必须确保字段i的数据不包含j!函数介绍:nvl(a,b,c,…)当a为空时取b,当b为空取c,以此类推.优化示例select*fromtab_i…

    2022年4月17日
    578
  • PostMan使用教程。

    PostMan使用教程。原地址:https://blog.csdn.net/haibo0668/article/details/83828184 Postman教程——发送第一个请求 Postman教程——创建第一个集合 Postman教程——界面功能导航 Postman教程——设置 Pos…

    2022年5月7日
    44
  • 2021Eclipse安装教程

    2021Eclipse安装教程第一步下载:官网地址:https://www.eclipse.org/downloads/第二步:下载好后,双击安装包,运行第三步:选择版本运行后有很多版本可供选择EclipseIDEforJavaDevelopers是为java开发的EclipseIDEforJavaEEDevelopers是为J2EE开发的EclipseforRCP/Plug-inDevelopers是为RCP和插件开发的EclipseIDEforC/C++Developers

    2022年5月10日
    86

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号