目标检测算法YOLO3论文解读

目标检测算法YOLO3论文解读论文题目:YOLOv3:AnIncrementalImprovement论文地址:https://arxiv.org/abs/1804.02767代码地址:https://github.com/aloyschen/tensorflow-yolo3一、论文解读1、boundingboxprediction(边界框预测)YOLO2预测boundingboxes是使…

大家好,又见面了,我是你们的朋友全栈君。

论文题目:YOLOv3: An Incremental Improvement

论文地址:https://arxiv.org/abs/1804.02767

代码地址:https://github.com/aloyschen/tensorflow-yolo3

 

一、论文解读

1、bounding box prediction(边界框预测)

YOLO2预测bounding boxes是使用anchor boxes,这个网络为每个bounding box预测了4个坐标:tx、ty、tw、th,用(cx,cy)表示当前网格左上角坐标偏移图像左上角坐标的距离,用pw,ph表示先验框(piror)的宽和高,可以得到下面式子:

目标检测算法YOLO3论文解读        目标检测算法YOLO3论文解读

在训练期间,使用平方和误差(sum of squared error loss)。真值用目标检测算法YOLO3论文解读表示,梯度就是真值减去预测值:目标检测算法YOLO3论文解读

YOLO3用logistic regression为每个bounding box预测一个分数。算法只为每个真值匹配一个最优的先验框。

 

2、多标签预测

每个bounding box可能含有多类物体,也就是多标签预测。所以用logistic(sigmoid)代替softmax,因为softmax表示每个框只有一类对象,而sigmoid可以预测多标签分类那么如何用sigmoid来做多标签分类呢?其实就是针对logits中每个分类计算的结果分别作用一个sigmoid分类器,分别判定样本是否属于某个类别。在训练期间,使用二元交叉熵损失函数进行类别预测。

sigmoid多标签预测参考博客:https://blog.csdn.net/qq_32172681/article/details/97936956

 

3、结合不同卷积层的特征,提取更细粒度的信息,做多尺度预测

YOLO3用3个不同的尺度预测boxes,网络采用类似特征金字塔的概念,从不同的尺度提取特征。在原先的基本特征提取器上新增了几个卷积层,最后用一个3维的张量表示bounding box、objectness和class predictions。在COCO中,在每个尺度上预测3个boxes,因此张量为N*N*[3*(4+1+80)],分别对应4个bounding boxes、1个objectness prediction和80个class predictions。接下来,从前面的两个图层中提取特征图,并将其向上采样2倍。从早期的网络中获取一个特征图,并使用串联将其与上采样特征合并。这种方法允许我们从上采样的特性中获得更有意义的语义信息,并从早期的特性图中获得更细粒度的信息。然后再添加一些卷积层来处理这个组合的特征图,并最终预测一个类似的张量,尽管现在的大小是原来的两倍。再次执行相同的设计,以预测最终框的尺寸。在过去,YOLO难以预测小的物体,现在通过多尺度预测,明显改善。

 

4、网络结构(DarkNet53 = Darknet19 + ResNet

  • 结合残差思想,提取更深层次的语义信息。
  • 仍然使用连续的3×3和1×1的卷积层。
  • 通过上采样对三个不同尺度做预测。如将8*8的特征图上采样和16*16的特征图相加再次计算,这样可以预测出更小的物体。
  • 采用了步长为2的卷积层代替pooling层,因为池化层会丢失信息。

如图所示:

目标检测算法YOLO3论文解读

 

5、预测更多目标

YOLO3仍然使用k-均值聚类来确定模板框,为每个网格预测9个bounding boxes(YOLO2只有5个、YOLO1只有2个),这样可以提高recall。

 

6、损失函数

在训练期间,使用二元交叉熵损失函数进行类别预测。YOLO v2损失函数的后三项是平方误差,而YOLO v3则更改为交叉熵误差项,也就是说YOLO v3的物品置信度和分离预测使用的是逻辑回归算法。

 

二、代码理解

1、构造残差块

 

2、darknet53网络结构,用于提取特征(使用了残差块)

目标检测算法YOLO3论文解读

3、yolo块(图中Convs)

yolo3在Darknet53提取的特征层基础上,又加了针对3种不同比例的feature map的block,这样来提高对小物体的检测率

目标检测算法YOLO3论文解读

目标检测算法YOLO3论文解读

4、构造yolo3模型结构,输出三种尺度的卷积层(conv2d_59, conv2d_67, conv2d_75)

目标检测算法YOLO3论文解读

5、目标检测模块,输出预测结果x,y,w,h,confidence,class_prob

根据不同大小的feature map做多尺度的检测(三种feature map大小分别为13x13x255, 26x26x255, 52x52x255)

目标检测算法YOLO3论文解读

6、之前输入图像时,按照长宽比缩放,对图像进行了填充,此处对box的坐标进行修正

目标检测算法YOLO3论文解读

7、损失函数(共4部分:框位置xy,wh,置信度confidence,类别class)

目标检测算法YOLO3论文解读

目标检测算法YOLO3论文解读

8、k-mean聚类算法(用于生成模版框)

目标检测算法YOLO3论文解读

9、对三个不同尺度的输出做非极大值抑制,得到最后物体检测框和预测类别

目标检测算法YOLO3论文解读

10、计算mAP,评价模型

目标检测算法YOLO3论文解读

目标检测算法YOLO3论文解读

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/150540.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 计算机网络基本知识汇总「建议收藏」

    计算机网络基本知识汇总「建议收藏」概述OSI分层(7层)物理层、数据链路层、网络层、运输层、会话层、表示层、应用层TCP/IP分层(4层)网络接口层、网络层、运输层、应用层五层协议(5层)物理层、数据链路层、网络层、运输层、应用层五层结构的概述应用层:通过应用进程间的交互来完成特定网络应用数据:报文协议:HTTP,SMTP(邮件),FTP(文件传送)运输层:向两个主机进程之间的通信提供通用的数据传输服务。

    2022年7月18日
    19
  • mybatis(pagehelper) dataTables实现分页功能

    mybatis(pagehelper) dataTables实现分页功能

    2021年5月12日
    175
  • Spring JpaTransactionManager事务管理

    Spring JpaTransactionManager事务管理    首先,在做关于JpaTransactionManager之前,先对Jpa做一个简单的了解,他毕竟不如hibernate那么热门,其实二者很相识,只不过后期hibernate和JDO版本都已经兼容了其Jpa,目前大家用的少了。   JPA全称JavaPersistenceAPI.JPA通过JDK5.0注解或XML描述对象-关系表的映射关系,并将运行期的实体对象持久化…

    2025年7月21日
    3
  • scratch编程小游戏黑白棋

    scratch编程小游戏黑白棋你有没有玩过一种游戏,就是按3X3排列的方块,方块中有黑有白,当你按下一个后周围的黑块会变成白块,白块变黑块,当全部的方块都变成白色是就赢了,今天我们就来编写这个游戏!首先来看看效果:知道怎么玩了吗?现在就来看看是怎么编写的吧!首先画出所有的角色:方块要画出一黑一白:方块首先要移动到合适的位置,然根据探测器来切换黑白:方块1:方块2:方块3:方块4:方块5:方块6:方块7:方块8:方块9:现在是最最最最重要的探测器程序了,探测器决定了布局的结果,保证不会

    2022年6月15日
    54
  • 无法停止usb大容量存储设备_大容量存储重启后就被禁用

    无法停止usb大容量存储设备_大容量存储重启后就被禁用需求:最近由于操作设置本机电脑组策略禁用可移动存储设备后,恢复不了USB大容量存储设备禁用后恢复不了问题解决方案:1:网上一大群所谓的知识分支提供了几乎拷贝的一致的答案:注册策略恢复设置。说多了都是泪啊,毛用没有。2:后面想到了下载软件(大势至usb控制系统8.1官方版)试一下吧:设置一下就可以了。该软件下载一个试用版本就行。下载链接如下:http://www.onlinedow…

    2022年10月7日
    3
  • pycharm激活码2021【永久激活】

    (pycharm激活码2021)JetBrains旗下有多款编译器工具(如:IntelliJ、WebStorm、PyCharm等)在各编程领域几乎都占据了垄断地位。建立在开源IntelliJ平台之上,过去15年以来,JetBrains一直在不断发展和完善这个平台。这个平台可以针对您的开发工作流进行微调并且能够提供…

    2022年3月22日
    155

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号