视频识别的基础概念[通俗易懂]

视频识别的基础概念[通俗易懂]视频识别一、视频识别几大问题2、常见的解决方案iDTTwo-StreamTSNC3DTDDRNNRPAN一、视频识别几大问题未修剪视频分类(UntrimmedVideoClassification):通过对输入的长视频进行全局分析,然后软分类到多个类别修剪视频识别(TrimmedActionRecognition):给出一段只包含一个动作的修剪视频,要求给视频分类时序行为提名(TemporalActionProposal):从长视频中找出可能含有动作的视频段时序行为定位(Tempor

大家好,又见面了,我是你们的朋友全栈君。

一、视频识别几大问题

  1. 未修剪视频分类(Untrimmed Video Classification):通过对输入的长视频进行全局分析,然后软分类到多个类别
  2. 修剪视频识别(Trimmed Action Recognition):给出一段只包含一个动作的修剪视频,要求给视频分类
  3. 时序行为提名(Temporal Action Proposal):从长视频中找出可能含有动作的视频段
  4. 时序行为定位(Temporal Action Localization):从视频中找到可能存在行为的视频段,并且给视频段分类
  5. 密集行为描述(Dense-Captioning Events):将一段未修剪的视频进行时序行为定位得到许多包含行为的视频段后,对该视频段进行行为描述

2、常见的解决方案

iDT

iDT算法框架主要包括:密集采样特征点,特征轨迹跟踪和基于轨迹的特征提取三个部分。
光流:在时间间隔很小的情况下,视频像素位移
特征提取:通过网格划分的方式在多尺度图像中分别密集采样特征点。通过计算特征点临域内的光流中值得到特征点运动方向。
在这里插入图片描述

编码:使用了HOF,HOG和MBH三种特征描述光流
HOG:灰度图像梯度直方图,HOG特征的长度为2238=96。
在这里插入图片描述
HOF:光流的直方图,8+1个bin,前8个和HOG相同,1是用于统计光流幅度小于某个阈值的像素。HOG特征的长度为2
239=108。
MBH:光流梯度直方图,在光流图像上计算HOG。光流图像包括x和y方向,所以MBH总的特征长度为2*96=192。

最后进行特征的归一化,DT算法中对HOG,HOF和MBH均使用L2范数进行归一化。

分类器:SVM

对于多分类:
评价指标:mAP、0-1 exact match、Macro-F1等
训练方法:
1)one hot encoding
用一系列的特征去拟合词汇,降低训练所需要的数据量。
2)CNN+RNN(CNN+LSTM)

Two-Stream

一部分处理RGB,一部分处理光流,最后联合训练再分类。
在这里插入图片描述

TSN

这是在Two-Stream上的改进,Two-Stream最大的问题是不能对长时间的视频进行建模,只能对连续几帧视频提取。TSN先将视频分成K个部分,然后从每个部分中随机的选出一个短的片段,然后对这个片段应用上述的two-stream方法,最后对于多个片段上提取到的特征做一个融合。下图是网络的结构图。
在这里插入图片描述

C3D

这个算法比Two-Stream精度低,但是快。网络结构更加简单。视频是三维,可以使用三维卷积核。
在这里插入图片描述

TDD

TDD特征结合了传统方法的轨迹跟踪和深度学习方法的卷积特征提取。
在这里插入图片描述

RNN

通过RNN可以处理序列问题。

RPAN

分为三大部分

  • 特征生成部分:用Two-Stream的方法生成
  • 姿态注意机制
  • LSTM时序处理网络

在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/130621.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • xshell如何激活_xftp6使用教程

    xshell如何激活_xftp6使用教程市面上连接服务器的客户端有很多,有免费的,也有收费的。有国产的也有非国产的。每个人使用的都不一样。很多也使用过,比如putty免费的,但是在我使用看来,使用一会就卡顿住了,最后就是需要重新连接,怎么用都不是很方便,最后还是的使用回来xshell和xftp。下面就来演示下如何安装xshell和xftp。首先是下载xshell和xftp的软件安装包。其实下载这个安装包是非常简单的,但是不简单的是如何下载一个真的能用的安装包。其次就是安装了。安装其实也是非常的简单的。下一步,下一步就可以完成.

    2025年10月9日
    6
  • aria2最新tracker服务器,【无灯+Hiboy】padavan下自动更新aria2的BT tracker 服务器列表…「建议收藏」

    aria2最新tracker服务器,【无灯+Hiboy】padavan下自动更新aria2的BT tracker 服务器列表…「建议收藏」本帖最后由Wildest_Dreams于2018-12-2120:00编辑首先,在`/etc/storage`目录创建`trackers_list_aria2.sh`在其它目录重启就会丢失脚本!在其它目录重启就会丢失脚本!在其它目录重启就会丢失脚本!荒野无灯版请输入以下代码:#!/bin/bash/usr/bin/aria.shstoplist=`wget-qO-https://r…

    2022年10月1日
    2
  • 阿里云 SSL证书部署(DigiCert 免费版 SSL)「建议收藏」

    阿里云 SSL证书部署(DigiCert 免费版 SSL)「建议收藏」阿里云DigiCert免费版SSL有效期一年,过期后需要重新部署SSL所以,不管是第一次部署SSL还是刚接手公司项目SSL就到期的小伙伴都可以看一下该文章,如果有疑问请把疑问写到评论区,我会一一回复问题,不断完善该篇文章

    2022年10月3日
    4
  • Spring Boot 核心编程思想-第二部分-读书笔记

    怕什么真理无穷进一步有近一步的欢喜说明本文是Spring Boot核心编程思想记录的笔记,书籍地址:Spring Boot编程思想(核心篇):这篇文档会记录这本我的一些读书的思考,内容可能…

    2022年3月1日
    44
  • 设置 IntelliJ IDEA 主题和字体的方法

    设置 IntelliJ IDEA 主题和字体的方法1前言在博文“IntelliJIDEA之HelloWorld项目创建及相关配置文件介绍”中,咱们已经用IntelliJIDEA创建了第一个Java项目HelloWorld,如下图所示:观察上图,大家有没有发现一些问题,例如,整个界面的字体是不是都太小了一点啊?不知道大家感受如何,反正博主看到这么小的字体,当真是头晕眼花啊!因此,接下来,就让咱们一起尝试着把IntelliJ

    2022年6月27日
    70
  • TCP三次握手图_tcp为什么三次握手

    TCP三次握手图_tcp为什么三次握手任TCP虐我千百遍,我仍待TCP如初恋。

    2022年10月3日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号