mask scoring rcnn_faster rcnn详解

mask scoring rcnn_faster rcnn详解1.M,对应着图像中的CNN部分,其对输入进来的图片有尺寸要求,需要可以整除2的6次方。在进行特征提取后,利用长宽压缩了两次、三次、四次、五次的特征层来进行特征金字塔结构的构造。ask-RCNN使用Resnet101作为主干特征提取网络2.ResNet101有两个基本的块,分别名为ConvBlock和IdentityBlock,其中ConvBlock输入和输出的维度是不一样的,所以不能连续串联,它的作用是改变网络的维度;IdentityBlock输入维度和输出维度相同,可以串联,用于加深网络的。

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

1.在这里插入图片描述

对应着图像中的CNN部分,其对输入进来的图片有尺寸要求,需要可以整除2的6次方。在进行特征提取后,利用长宽压缩了两次、三次、四次、五次的特征层来进行特征金字塔结构的构造。Mask-RCNN使用Resnet101作为主干特征提取网络

2.ResNet101有两个基本的块,分别名为Conv Block和Identity Block,其中Conv Block输入和输出的维度是不一样的,所以不能连续串联,它的作用是改变网络的维度;Identity Block输入维度和输出维度相同,可以串联,用于加深网络的。
在这里插入图片描述
结构左边为卷积,右边为残差边(short cut),没有残差边维度是不会改变的,所以Conv Block是会改变维度的,而Identity Block是不会改变维度的,
在这里插入图片描述
(resnet101整体结构(7,7)是卷积大小,stride为步长

之后长宽被压缩为一半,即(512 X 512)
在这里插入图片描述

stride=(1,1)时,输出的图片大小与输入的图片大小一样。

3.有输入filter的值
identity_block有输入三个filter,分别是64 64 256功能:
作为平静结构
在这里插入图片描述

在这里插入图片描述
原本进行卷积时,通道数:
在这里插入图片描述

直接进行3×3卷积参数量比较大,利用平静结构先转1×1卷积压缩通道数,再转为3×3进行卷积之后再转回1×1卷积将通道数返回来,目的是为了减少中间网络的参数量,同时可以提高检测效果,加深网络深度
在这里插入图片描述
identity_blok:由平静结构和残差边组成
结构里只有通道数不同,resnet101很多重复的

4.长宽压缩了两次C2、三次C3、四次C4、五次C5的结果来进入特征金字塔结构进行融合,获得P2, P3 P4 P5,他们会作为RPN网络的有效特征层,

在这里插入图片描述
在这里插入图片描述

5.特征金字塔的构建:
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/188103.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号