特征金字塔池化

全栈程序员-站长 • 2025年10月28日下午2:15 • 未分类 • 阅读 3

特征金字塔池化1 特征金字塔池化如上图所示将特征图的所有像素划分为 n nn timesnn n 个网格并将其经过核为 n nn timesnn n 步长为 n n n n n n 的池化可以选择最大池化或者平均池化经过较为密集的池化 4 times4 形成形成形成 N timesC timesn timesn 的特征图将其串联形成的特征图将其串联形成的特征图将其串联形成 C times 的格式之后在第 2 个步骤池化得到的特征图的基础上取不同的 nnn 值进行下一个池

1. 特征金字塔池化

特征金字塔池化

如上图所示：

将特征图的所有像素划分为 $n\times n$ 个网格，对每个网格进行池化，池化层的核大小即为网格大小，宽度不符合时可以padding
取不同的n值，重复1过程；
将上述过程得到的所有结果经过flatten和concat,得到 $C\times N$ 格式的特征图，可以直接用于全连接。

输出的结果只与 $n$ 值和通道数量相关,而与输入Tensor的形状无关（当然不能太小，否则池化结果为0）

2. 实现

完整代码连接：古承风的gitee

以下是核心代码


def _spp_layer(self,x:torch.Tensor,mode='max',grid_nums:list=[16]):
        """ output_num denote an grid's width steps: --- 1. compute width for specific output_num, sqrt(num) 2. compute pooling's kernel_size and stride 3. pooling 4. concat all the output """
        N,C,H,W = x.size()
        for i in range(len(grid_nums)):
            # step1
            
            h = ceil(H/(sqrt(grid_nums[i])))
            w = ceil(W/(sqrt(grid_nums[i])))
            
            h_pad = int(((h*sqrt(grid_nums[i])+1)-H)/2)
            w_pad = int(((w*sqrt(grid_nums[i])+1)-W)/2)
            # step2
            if mode == "max":
                pool = nn.MaxPool2d(kernel_size=(h,w),stride=(h,w),padding=(h_pad,w_pad)) 
            elif mode=='avg':
                pool = nn.AvgPool2d(kernel_size=(h,w),stride=(h,2),padding=(h_pad,w_pad))
            else:
                raise ValueError(f"{ 
      mode} mode type error ,expect 'max' and 'avg'")
            
            temp = pool(x) # to origin x , means pyramid pooling
            
            # if for fully connected , could use this concat method
            if i == 0:
                output = temp.view(N,-1)
            else:
                output = torch.concat((output,temp.view(N,-1)),-1)

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们举报，一经查实，本站将立刻删除。

发布者：全栈程序员-站长，转载请注明出处：https://javaforall.net/232170.html原文链接：https://javaforall.net

赞 (0)

全栈程序员-站长

0 0

防盗链原理

防盗链原理引子：明明引用了一个正确的图片地址，但显示出来的却是一个红叉或写有“此图片仅限于***网站用户交流沟通使用”之类的“假图片”（下图便是网易博客的防盗链效果）。用嗅探软件找到了多媒体资源的真实地址用下载软件仍然不能下载。下载一些资源时总是出错，如果确认地址没错的话，大多数情况都是遇上防盗链系统了。常见的防盗链系统，一般使用在图片、音视频、软件等相关的资源上。一、什么是

全栈程序员-站长
2022年7月23日
17
java中用正则表达式截取字符串_正则表达式除去指定字符串

java中用正则表达式截取字符串_正则表达式除去指定字符串正则表达式字符意义：. 符合任一字符/d 符合0～9任一个数字字符/D 符合0～9以外的字符/s 符合/t、/n、/x0B、/f、/r等空格符/w 符合a～z、A～Z、0～9等字符，也就是数字或是字母都符合/W 符合a～z、A～Z、0～9等之外的字符，也就是除数字与字母外都符合举例来说，如果有一字符串abcdebc

全栈程序员-站长
2025年7月9日
2
史记乔布斯列传

史记乔布斯列传

全栈程序员-站长
2021年8月14日
112
Android开发环境搭建（图文教程）

Android开发环境搭建（图文教程）

全栈程序员-站长
2021年11月28日
39
压测工具jmeter怎么使用_并发压力测试工具

压测工具jmeter怎么使用_并发压力测试工具一、Jmeter下载进入官网：http://jmeter.apache.org/1.第一步进入官网如下图2.选择进行下载，下载下来为一个压缩包，解压即可。3.我下载的是jmeter4.0版本，

全栈程序员-站长
2022年8月2日
7
修改源码去除zblog博客分类目录的RSS图标

修改源码去除zblog博客分类目录的RSS图标

全栈程序员-站长
2021年11月16日
56

发表回复

关注全栈程序员社区公众号