opencv行人检测python_19年赚钱新思路

opencv行人检测python_19年赚钱新思路CVPR2019行人检测新思路:高级语义特征检测取得精度新突破原创: CV君 我爱计算机视觉 今天点击我爱计算机视觉置顶或标星,更快获取CVML新技术今天跟大家

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

CVPR 2019 行人检测新思路:高级语义特征检测取得精度新突破

点击我爱计算机视觉置顶或标星,更快获取CVML新技术


 

今天跟大家分享一篇昨天新出的CVPR 2019论文《High-level Semantic Feature Detection:A New Perspective for Pedestrian Detection》,作者将行人检测问题转化为高级语义特征检测的问题,刷新了行人检测精度的新高度!而且作者称代码将开源。

 

论文作者信息:

 

opencv行人检测python_19年赚钱新思路

 

作者分别来自国防科技大学、中科院自动化所、阿联酋起源人工智能研究院和地平线机器人公司。

 

算法思想

 

特征检测是计算机视觉中常用算法,比如我们所熟知的边缘检测、Blob检测,简单点说就是检测图像中的感兴趣部分。在传统的计算机视觉视觉中,这往往被认为是low-level的操作。

 

随着深度学习技术的发展,一般认为深度学习提取的特征具有高级语义特性。

 

作者认为行人检测中行人的中心点(x,y坐标)和尺度(宽高)是一种高级语义特征,行人检测完全可以转化为这些语义特征的检测。

 

如下图所示:

 

opencv行人检测python_19年赚钱新思路

 

输入图像经过卷积网络,然后分成Center Heatmap计算和Scale Map 计算,得到的中心点坐标和宽高大小,即检测出了行人。

 

看起来很简单,但却是很有效!

 

下图是更详细的网络架构图:

 

opencv行人检测python_19年赚钱新思路

 

该算法最主要的两部分为特征提取模块和Detection Head模块。

特征提取模块对4个Stage的特征图进行了串联,以增强特征的多尺度表达能力。

Detection Head模块,由256个3*3卷积和分支开来的两个1*1卷积组成,然后分别成为最终的Center heatmap 和Scale Map。

 

将现有标注好的行人检测数据集转化为中心点和尺度标注的方法是显而易见的,如下图(图中作者使用log(高度)作为行人尺度):

 

opencv行人检测python_19年赚钱新思路

 

在Point Prediction 这一端,作者实际上尝试了中心点、顶部顶点、底部顶点等三种方式,实验结果如下图上半部分,发现使用中心点效果最好,而且是远好于另外两者。

 

opencv行人检测python_19年赚钱新思路

 

同样在Scale Prediction这一端,作者尝试了预测高度、宽度和二者都预测。发现只预测高度的效果最好(此时设置固定宽高比0.41)。

 

实验结果

 

下面三张图是在Caltech数据集上的实验结果,该文提出的算法CSP均取得了最高的精度。

 

opencv行人检测python_19年赚钱新思路

opencv行人检测python_19年赚钱新思路

opencv行人检测python_19年赚钱新思路

 

下图为在CityPersons数据集上的实验结果,CSP同样取得了最好的结果。

 

opencv行人检测python_19年赚钱新思路

 

另外,值得一提的是,该算法不仅仅适用于行人检测!在作者的Github工程主页上放出了使用该文算法在人脸检测数据集WiderFace上的实验结果,在验证集和测试集上均取得了最高精度或者媲美最高精度的结果。

 

如下图所示:(请点击大图查看)

 

opencv行人检测python_19年赚钱新思路

 

读完此文,CV君在想,人脸和行人的宽高比相对变化较小,该文提出的算法取得了很不错的结果。那么对于通用目标检测,宽高比变化比较大,该算法结果会如何呢?希望有进一步实验结果出来。

 

希望该文对你有帮助!

 

论文地址:

https://arxiv.org/abs/1904.02948v1

代码地址:

https://github.com/liuwei16/CSP

 

 


opencv行人检测python_19年赚钱新思路

长按关注我爱计算机视觉

麻烦给我一个“在看”

阅读
 2622

 
精选留言

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/167121.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • python使用(二)

    python使用(二)

    2022年2月21日
    51
  • 动手实操丨RC522射频卡模块与IC卡完成充值消费查询的技术实现思路

    动手实操丨RC522射频卡模块与IC卡完成充值消费查询的技术实现思路一文手把手教你利用RC522射频卡模块与IC卡完成充值消费查询的技术实现思路。

    2022年7月26日
    6
  • sublime text3 替换(sublime替换成换行符)

    我遇到一个文章,需要把所有的(数字)换为[数字]于是我使用SublimeText的替换首先,我们需要打开正则使用“Alt+R”或打开“Ctrl+h”选择正则。然后我们开始输入正则,“((\d+)”我们需要拿出的是数字,所有在数字加“()”。于是在替换写“[1\]”,其中1\]”,其中0就是所有的,$1就是第一个括号。如何使用正则可以去看正则表达入门。Suml

    2022年4月10日
    557
  • linux文件重命名命令rename_修改文件名linux

    linux文件重命名命令rename_修改文件名linuxlinux下重命名文件有两种方式:1.较简单的处理命令:mvmv原文件名新文件名如:mvmyFilenewName将MyFile重命名为newName.2.linux提供了一个重命名文件命令:renamerenamefromtofile1file2。。。如:renamemyFilenewNamemyFile.text将myFile.text重命名为newName.text这个命令在批量重命名是更好用如:renamemyFilenewNamemy

    2025年10月25日
    3
  • 秒秒钟解决打开ps图片显示无法完成请求,因为程序错误「建议收藏」

    秒秒钟解决打开ps图片显示无法完成请求,因为程序错误「建议收藏」问题描述今天在做ps作业的时候做到一半,保存的时候卡了一下,我等了一会,不卡了,我以为我保存了就没什么事了,然后就关闭ps,软件关闭的时候也卡了一下,结果现在想接着做的时候打不开了,做了那么久那么多图层都在,我心态直接崩了,白做了。当我赶紧上网查怎么修复和解决。全特码是p话,一个有用的都没有,说什么右键ps属性,兼容性的运行,管理员打开,设置好后就可以直接打开了,我特么又不是兼容性的问题,之前一直用的好好的,还有打开ps清理暂存盘,缓存大小改大,我。。。。。。呵呵。还有说检查ps是否更新了,说什么确保系.

    2025年5月25日
    2
  • 二叉树的应用:求解四则运算建议收藏

    一二叉树如何表示四则运算1.1 表达式转换为二叉树上图是表达式“3+2*9-16/4”转换成的二叉树,观察表达式,可以看出:(1)操作数都是叶子节点;(2)运算符都是内部节点;(

    2021年12月19日
    56

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号