【深度学习】【语义分割】ASPP

【深度学习】【语义分割】ASPPASPP空洞空间卷积池化金字塔(atrousspatialpyramidpooling(ASPP))对所给定的输入以不同采样率的空洞卷积并行采样,相当于以多个比例捕捉图像的上下文。上图为deeplabv2的ASPP模块,deeplabv3中向ASPP中添加了BN层,其中空洞卷积的rate的意思是在普通卷积的基础上,相邻权重之间的间隔为rate-1,普通卷积的rate默认为1,所以…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

ASPP

空洞空间卷积池化金字塔(atrous spatial pyramid pooling (ASPP))对所给定的输入以不同采样率的空洞卷积并行采样,相当于以多个比例捕捉图像的上下文。
deeplab v2的ASPP

上图为deeplab v2的ASPP模块,deeplabv3中向ASPP中添加了BN层,其中空洞卷积的rate的意思是在普通卷积的基础上,相邻权重之间的间隔为rate-1, 普通卷积的rate默认为1,所以空洞卷积的实际大小为 k + ( k − 1 ) ( r a t e − 1 ) k+(k-1)(rate-1) k+(k1)(rate1),其中k为原始卷积核大小。

输出大小如何计算?
在这里插入图片描述

问题:当rate接近feature map大小时, 3 × 3 3\times3 3×3滤波器不是捕获全图像上下文,而是退化为简单的 1 × 1 1\times1 1×1滤波器,只有滤波器中心起作用。

改进:Concat( 1 × 1 1\times 1 1×1卷积 , 3个 3 × 3 3\times 3 3×3空洞卷积 +,pooled image feature)并且每个卷积核都有256个且都有BN层。
在这里插入图片描述

#without bn version
class ASPP(nn.Module):
    def __init__(self, in_channel=512, depth=256):
        super(ASPP,self).__init__()
        self.mean = nn.AdaptiveAvgPool2d((1, 1)) #(1,1)means ouput_dim
        self.conv = nn.Conv2d(in_channel, depth, 1, 1)
        self.atrous_block1 = nn.Conv2d(in_channel, depth, 1, 1)
        self.atrous_block6 = nn.Conv2d(in_channel, depth, 3, 1, padding=6, dilation=6)
        self.atrous_block12 = nn.Conv2d(in_channel, depth, 3, 1, padding=12, dilation=12)
        self.atrous_block18 = nn.Conv2d(in_channel, depth, 3, 1, padding=18, dilation=18)
        self.conv_1x1_output = nn.Conv2d(depth * 5, depth, 1, 1)
 
    def forward(self, x):
        size = x.shape[2:]
 
        image_features = self.mean(x)
        image_features = self.conv(image_features)
        image_features = F.upsample(image_features, size=size, mode='bilinear')
 
        atrous_block1 = self.atrous_block1(x)
        atrous_block6 = self.atrous_block6(x)
        atrous_block12 = self.atrous_block12(x)
        atrous_block18 = self.atrous_block18(x)
 
        net = self.conv_1x1_output(torch.cat([image_features, atrous_block1, atrous_block6,
                                              atrous_block12, atrous_block18], dim=1))
        return net

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/171645.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • pip和conda安装与卸载tensorflow、pycharm中使用特定的conda虚拟环境「建议收藏」

    pip和conda安装与卸载tensorflow、pycharm中使用特定的conda虚拟环境「建议收藏」写吴恩达dp作业做的准备参考https://blog.csdn.net/ccgcccccc/article/details/89058445根据他的配置要求来配置文件pipinstalltensorflow==1.13.0rc2-ihttps://pypi.tuna.tsinghua.edu.cn/simple或者-ihttps://mirrors.aliyun.com/py…

    2022年6月22日
    48
  • OCL功率放大电路[通俗易懂]

    OCL功率放大电路[通俗易懂]OCL(OutputCapacitorLess)是OTL电路的升级,指省去输出端大电容的功率放大电路,省去了输出电容,使系统的低频响应更加平滑。缺点是必须用双电源供电,增加了电源的复杂性。1.工作原理当输入信号为正半周期时,V1导通,V2截止,电流方向为+vcc,V1的集电极,V1的发射极,负载,地。当输入信号为负半周期时,V1截止,V2导通,电流方向为地,负载,V2的发射极,V2的集…

    2022年6月5日
    63
  • visio的安装教程2019_anaconda安装教程

    visio的安装教程2019_anaconda安装教程Visio的安装教程  Visio使你能够将复杂的文本和表转换为很难理解的可视化图表,以便快速传达信息。有许多类型的Visio图表,包括组织结构图、网络图、工作流和家庭或office计划。Visio入门可以分为三个基本步骤:使用模板、排列和连接形状以及使用文本修改形状。教程矢量图:https://www.iconfont.cn/模板:https://huaban.c…

    2025年7月31日
    3
  • 调整Android Studio分配内存大小

    调整Android Studio分配内存大小

    2021年9月30日
    1.3K
  • 大整数乘法–leetcode Multiply Strings

    大整数乘法–leetcode Multiply Strings大整数乘法本文转载自 http www cnblogs com TenosDoIt p 3735309 html 我们在日常的大整数计算中 通常是把它转化为字符型计算 这道题的思路就和我们小学计算乘法一样 想乘的的结果 错位相加 最终进位 得到我们的结果 题干如下 Giventwonon negativeinte

    2026年2月2日
    2
  • jsonfield注解不生效(write javabean error fastjson)

    @jsonfield看源码它可以作用于字段和方法上。引用网上说的,一、作用field@jsonfield作用在field时,其name不仅定义了输入key的名称,同时也定义了输出的名称。但是我在使用中,发现并不如上所说。例如@jsonfield(name=”project_id”)privatelongprojectid发现bean转json的时候并是”project_id”:xxx的形式,…

    2022年4月17日
    66

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号