初识行为识别

初识行为识别随着互联网的不断发展,各种应用的不断推广。数据无论从存储,格式,形式,类型等方面都趋向于多样化,丰富化,指数化。数据就是价值,为何这么说呢?在机器学习,深度学习推动下,训练数据需求很大。对于分类模型,训练数据越多,分类器的准确度会在一定程度上更精确。行为识别可以说就是在这基础上演变出来的一个研究分支。那么什么是行为识别呢?我的理解是这样的,比如对于某个图片或者视频中的某个信息进行捕获,我们可以使用…

大家好,又见面了,我是你们的朋友全栈君。

随着互联网的不断发展,各种应用的不断推广。数据无论从存储,格式,形式,类型等方面都趋向于多样化,丰富化,指数化。数据就是价值,为何这么说呢?在机器学习,深度学习推动下,训练数据需求很大。对于分类模型,训练数据越多,分类器的准确度会在一定程度上更精确。行为识别可以说就是在这基础上演变出来的一个研究分支。那么什么是行为识别呢?我的理解是这样的,比如对于某个图片或者视频中的某个信息进行捕获,我们可以使用特征工程进行特征提取,这些特征提取说白了就是基于对图片局部中像素进行操作,对于视频,我们可以将视频按帧分解成图片,常用工具有ffmpeg,也可以使用python中基于视频分解图片的模块包自行通过调用处理。对于得到的图片,我们可以对其进行特征提取,比如常用的特征提取方法有Haar,Hog等,它们在结合具体的分类器比如adaboost,svm等可以对图片中相关特征精确提取达到一定准确度。有了特征之后,我们可以使用机器学习中分类器或者深度学习中的分类器利用已经得到特征进行训练,之后对未知图片进行预测,这也就达到了行为识别的目的。
行为识别存在问题?由于受到视频背景混乱、闭塞、视点变化等原因,对行动的准确识别是一项极具挑战性的任务,大多数现有方法对拍摄视频的环境做出某些假设。然而,这种假设在现实环境中很少成立。此外,大多数在这些方法都遵循传统的模式模式识别,包括两个步骤,第一步从原始视频中计算并提取特征,第二步通过该特征训练分类器。在现实世界中在场景中,很少知道哪些特征对手头的任务很重要,因为特征的选择是高度依赖问题。特别是对于人类行为识别。
行为识别的发展从哪开始呀?关于行为识别最早开始于19世纪中后期,科学家首先在动物行为方面进行了机械学研究[1]。但是由于当时的计算机不能处理大规模的数据计算,行为识别的研究也没有得到重视。直到20年代末期,关于行为识别的研究也是寥寥可数,当时的研究人员通过采集大量的实验数据进行分析和研究,训练并构建模型,然后匹配模型和行为序列,最终达到行为理解的目的。由于计算量的规模性,当时的研究只能局限于分析简单的行为运动。进入本世纪后,世界上多家名校和研究机构都在行为识别进行了深入研究和探索[2]。在工业界,行为识别可以说占据了普遍优势,如行程规划,用户社交行为,人员调度等领域已经出现了行为识别的相关应用。行为识别和模式识别比较火热的研究话题。
行为识别的的发展如何呢?目前行为识别的主要有两大流派:Two-Stream和C3D。Two-Stream的思想是是基于视频帧图像,其表示的是静态信息和对视频序列中每两帧计算密集光流得到的光流序列,该序列表示的是时序信息,然后利用相关深度网络对它们分别训练出一个模型,在各自网络产生结果后,对结果进行融合;它能有效的从一张图片中识别出行为的类别。利用双流CNN网络分别基于RGB图像和由视频得到的光流序列各自训练一个模型,这两个模型分别对动作进行判断,最后将两这训练结果进行融合,在UCF-101数据库上准确率达到88%,在HMDB51行为数据库达到59.4%[3]。将双流网络改成VGG-16网络,VGG-16卷积神经网络探索了深度与其性能之间的关系,通过反复堆叠33的小型卷积核和22的最大池化层,层数为16层,经实验提高了准确率[4]。C3D对CNN中的卷积(convolution)操作和池化(pooling)操作进行改良,其采用3D卷积核,在时间和空间维度上进行操作,能捕捉到视频流中的运动信息。一个用于人类行为识别的3D CNN架构,该体系结构由1个硬接线层、3个卷积层、2个子采样层和1个全连接层组成,以7帧尺寸为60×40帧作为3D CNN模型的输入。采用不同的卷积规模,最终在TRECVID DATA上的精准率达到了71.37%[5]。
可能对于深入的研究可能还有需要多去研究相关论文,多去动手上机实验。谢谢!

参考文献
[1]陈晓峰. 电子商务安全性理论与技术研究[D]. 西安: 西安电子科技大学, 2003.
[2]SEOH J, MILANFAR P. Action recognition from one example[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(5): 867-882.
[3]Simonyan K, Zisserman A. Two-Stream Convolutional Networks for Action Recognition in Videos[J]. 2014.
[4]Feichtenhofer, C. , Pinz, A. , & Zisserman, A. . (2016). Convolutional two-stream network fusion for video action recognition.
[5]Ji, S. , Xu, W. , Yang, M. , & Yu, K. . (2013). 3d convolutional neural networks for human action recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(1), 221-231.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/152029.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • IIC通信协议总结(详细说明完整过程)

    IIC通信协议总结(详细说明完整过程)IIC协议简介IIC(inter-integratedCircuit集成电路总线)总线支持设备之间的短距离通信,用于处理器和一些外围设备之间的接口,它需要两根信号线来完成信息交换。IIC的一个特殊工艺优势是微控制器只需要两个通用I/O引脚和软件即可控制芯片网络。IIC最早是飞利浦在1982年开发设计并用于自己的芯片上,一开始只允许100Khz、7-bit标准地址,1992年,IIC的第一个公共规范发行,增加了400Khz的快速模式以及10bit地址扩展。IIC协议IIC协议把传输的消息分为两种类型

    2022年5月2日
    144
  • centos7 配置lamp 环境[通俗易懂]

    centos7 配置lamp 环境[通俗易懂]搭建版本版本组合php5.6+apache/2.4.6(centos7)+mysql5.7.24因为新系统不能确认哪些指令已经搭建所以安装前需要确认下是否拥有检测是否已经安装过Vimrpm-qa|grepvim显示出完整的包名:vim-common,vim-enhanced,vim-minimal,vim-filesystem表示安装成功若是缺少Vim包名:则使用命令:比如说:vim-enhanced这个包少了,执行:yum-yinstallvim-enha..

    2022年5月29日
    39
  • deep learning with pytorch中文版_pytorch distributed

    deep learning with pytorch中文版_pytorch distributed憨批的语义分割重制版9——Pytorch搭建自己的DeeplabV3+语义分割平台注意事项学习前言什么是DeeplabV3+模型代码下载DeeplabV3+实现思路一、预测部分1、主干网络介绍2、加强特征提取结构3、利用特征获得预测结果二、训练部分1、训练文件详解2、LOSS解析训练自己的DeeplabV3+模型一、数据集的准备二、数据集的处理三、开始网络训练四、训练结果预测注意事项这是重新构建了的DeeplabV3+语义分割网络,主要是文件框架上的构建,还有代码的实现,和之前的语义分割网络相比,更加

    2022年8月21日
    8
  • 国产操作系统: 盘点8款国产Linux桌面操作系统[通俗易懂]

    国产操作系统: 盘点8款国产Linux桌面操作系统[通俗易懂]2014年4月8日起,美国微软公司停止了对WindowsXPSP3操作系统提供服务支持,这引起了社会和广大用户的广泛关注和对信息安全的担忧。在这种背景下,国家出于计算机安全考虑,加大了针对操作系统开发力度,各软件企业纷纷开发自主操作系统。国产操作系统多以Linux为基础二次开发,今天我们为大家盘点一下二零一八年值得用户使用的国产Linux桌面操作系统。1.深度操作系统…

    2022年5月13日
    90
  • 原生ajax请求的五个步骤

    原生ajax请求的五个步骤什么是ajax?通过在后台与服务器进行少量数据交换,Ajax可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行更新。ajax的优点:1.实现局部更新(无刷新状态下)2.减轻了服务器端的压力ajax的缺点:1.破坏了浏览器前进和后退机制(因为ajax自动更新机制)2.一个Ajax请求多了,也会出现页面加载慢的情况。3.搜索引擎的支持程度比较低。4.ajax的安全性问题不太好(可以用数据加密解决)。注:如果要使用ajax必须要有后端环境的支持(服务器端)。

    2022年5月17日
    183
  • 力争群雄:2012年度IT博客大赛100强脱颖而出[通俗易懂]

    力争群雄:2012年度IT博客大赛100强脱颖而出[通俗易懂]2012年度IT博客大赛于11月20日圆满结束。这一所谓的“海选”阶段为期33天,引无数网友和博主翘首以待,来源包括51CTO、独立个人博客、其他博客服务托管商,以及今年评选新增加的分类如独立博客、学生博客和团队博客等众多博主共同参加了这一角逐,其中100位实力雄厚和人气充盈的博主获得了前100强的殊荣。他们占据了25万张票选中的8成以上份量,并将为2012年度IT博客50…

    2022年7月21日
    12

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号