【池化选择】全局最大池化和全局平均池化的实验分析

根据MIT的LearningDeepFeaturesforDiscriminativeLocalization论文中的描述,在使用类响应图classactivationmapping(CAM)对比全局平均池化Globalaveragepooling(GAP)vs全局最大池化globalmaxpooling(GMP):类响应图示例:…

大家好,又见面了,我是你们的朋友全栈君。

根据MIT的 Learning Deep Features for Discriminative Localization论文中的描述,在使用类响应图class activation mapping (CAM) 对比全局平均池化Global average pooling (GAP) vs 全局最大池化global max pooling (GMP):

类响应图示例:
在这里插入图片描述
图中高亮区域就是根据label的注意图高响应区域

具体得到的这个相应区的方法是

在这里插入图片描述
1) 训练主干网络得到特征图
2) 进行全局池化(图中用的GAP,也可以使用GMP)
3) 对全局池化的结果做全连接得到全连接参数 w
4) 把全连接参数作为权重对特征图进行加权求和 上图最下方的公式

根据对图像的研究发现,不同的类别的特征图相应区域不一样,原始的卷积网络具有一定的定位能力。而且如下图所示,不同类别的注意力区域也大不相同也呈现出非常准确的特征区域。

模型可以预测出不同类别概率,根据类注意图发现。即使是错误预测的类别,比如上图预测狗狗预测成了人,但是人也在图中特征区域也是定位在了人的身上。

说了这么多就是论证GAP和GMP具有定位能力。那么具体那个好呢

先看一组实验
在这里插入图片描述

我们发现相比GAP,GMP在同一个类别上的top1 和top5 的损失都有所升高。

原因分析:
GAP 是对全局求平均,GAP LOSS 促使网络区分辨每个类别的程度,找到所有的目标可区分区域进行预测。
GMP 是对全局求最大,只去找分数最高的那个区域。而去忽略其他分数低的区域

因此在定位方面,GAP 比GMP要好

GAP outperforms GMP for localization.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/127458.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Notes的命名和地址

    Notes的命名和地址

    2021年7月27日
    71
  • json转string转list转对象

    json转string转list转对象1 对象转 stringString JSONObject toJSONString T 2 string 转对象 Tt JSONObject parseObject pojo T tclass 3 Lits 转 stringString JSON toJSONString tList 4 String 转 listList lt

    2025年9月21日
    3
  • 高分卫星系列介绍_高分6号卫星参数

    高分卫星系列介绍_高分6号卫星参数celestrak高分卫星系列TLEGAOFEN1,139150U13018A22047.13058851.0000039900000+064218-409992,23915097.8040117.23550018056314.685945.288614.76596516474837GAOFEN2,140118U14049A22047.06986400.0000059700000+084233-409994,240118

    2025年8月2日
    3
  • h5 实现图片上传 案例

    h5 实现图片上传 案例如何在 h5 中实现图片上传 单图片上传 先写一个按钮 通过点击按钮触发文件上传的 onclick 事件 divclass btn onclick takePhone 请点击进行拍照 inputtype file name file id upload capture camera onchange uploadImg accept image value inputtype file name file id upload capture camera onchange uploadImg accept image divclass btn onclick takePhone

    2025年6月25日
    4
  • [Android] Bitmap内存在各系统版本的演化

    聚焦的问题1、Bitmap的像素数据是存在哪里的?2、Bitmap内存如何释放?需要调用recycle吗?Bitmap bitmap = Bitmap.createBitmap(100,100,Bitmap.Config.ARGB_8888);以这样声明一个bitmap为例,有三个位置需要关注,bitmap引用本身所在的位置(栈),引用指向的对象所在的位置(堆),对象中持有的像素数据所在的…

    2022年3月11日
    36
  • odoo连接数据库操作数据「建议收藏」

    #!/usr/bin/envpython#_*_coding:utf-8_*_importpsycopg2db=psycopg2.connect(“dbname=linxerpuser=postgres”)vals=db.cursor()vals.execute(“selectidfromir_translationwherevalue=’产品接收证明单号:’;

    2022年4月15日
    86

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号