deeplab系列详解(简单实用年度总结)

1、卷积神经网络为什么具有平移不变性?不变性可分为:平移不变性:TranslationInvariance 旋转/视角不变性:Ratation/ViewpointInvariance 尺度不变性:SizeInvariance 光照不变性:IlluminationInvarianceCNN=卷积+池化图像的特征被平移了,那么在卷积的过程中,特征提取也相应的被平移了…

大家好,又见面了,我是你们的朋友全栈君。

1、卷积神经网络为什么具有平移不变性?

不变性可分为:

  • 平移不变性:Translation Invariance
  • 旋转/视角不变性:Ratation/Viewpoint Invariance
  • 尺度不变性:Size Invariance
  • 光照不变性:Illumination Invariance

CNN = 卷积 + 池化

图像的特征被平移了,那么在卷积的过程中,特征提取也相应的被平移了。

在池化过程中,它返回感受野中的最大值或平均值,感受野仍然对应着图像的特征信息。

所以,CNN具有平移不变性。

2、卷积神经网络为什么很难处理像素级别的分类问题?

  • 重复池化和下采样导致分辨率大幅下降,位置信息丢失难以恢复
  • 空间不变性导致细节信息丢失

其实就是卷积和池化导致缺失了很多图像细节位置信息。

3、deeplab v1做了哪些工作?

问题:DCNNs的不变性不足够进行语义分割。

方法:结合DCNNs和概率图模型,即DCNNs最后一层响应和条件随机场解决分割问题。

4、deeplab v2做了哪些工作?

问题:语义分割问题。

方法:空洞卷积、金字塔池化、DCNNs+CRF。

1、用上采样滤波或空洞卷积(Atrous Convolution)突出卷积,是密集预测任务中强大工具。空洞卷积允许在DCNNs计算的特征响应上显示控制分辨率。同时在不增加参数量和计算复杂度情况下有效扩大滤波感受野来混合更丰富的上下文信息。

2、提出一个带空洞空间金字塔pooling(ASPP)在多尺度上稳定分割目标。ASPP使用多个采样率和有效视野的滤波器探测传入的卷积特征层,从而捕获多个尺度的对象和图像上下文。

3、提出目标边界的定位,通过结合DCNNs和概率模型。普通DCNNs中max-pooling和下采保持不变性但对定位精确度有影响,用DCNNs和CRF结合解决定位精确度问题。

空洞卷积作用:增强密集预测、扩大感受野。

空洞空间金字塔池化作用:多尺度图像表示。(多尺度特征提取+信息融合)

DCNNs+CRF作用:对精确边界的结构预测。

5、deeplab v3做了哪些工作?

问题:语义分割精确度问题。

方法:编-解码结构,引入解码模块;结合Xception model和深度可分卷积(depthwise separable convolution)和ASPP、解码模块。

DeepLabv3,通过增加简单有效的解码模块精细分割结果尤其物体边界。进一步,使用Xception model和深度可分卷积(depthwise separable convolution),结合ASPP和解码模块得到一个更快、更强的编-解码网络。

6、deeplab系列工作?

Deeplabv1使用CRF后处理,提高分割边界的精确度;

Deeplabv2使用空洞卷积扩大感受野,使用洞空间金字塔池化实现多尺度预测和上下文信息提取,同时用到后处理CRF;

Deeplabv3不使用后处理,使用编-解码结构提高分割边界预测,使用深度分离卷积和Xception模块。

 

 

 

 

 

 

 

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/128203.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • oracle insert select语句

    oracle insert select语句oracleinsertselect语句

    2022年7月17日
    20
  • 第五章《函数》

    第五章《函数》

    2021年5月28日
    113
  • drupal学习教程(待续)「建议收藏」

    drupal学习教程(待续)「建议收藏」1.drupal模块安装a.安装captcha模块–>模块–>用户贡献的模块–>b.启用captcha模块–>模块–>选择–>保存配置c.汉化captcha模块打开https://localize.drupal.org/translate/languages/zh-hans下载captcha汉化包–>配置–>翻译–>导入b.配置capt

    2022年6月12日
    26
  • leetcode 堆排序_leetcode合并两个有序数组

    leetcode 堆排序_leetcode合并两个有序数组给你一个链表数组,每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中,返回合并后的链表。示例 1:输入:lists = [[1,4,5],[1,3,4],[2,6]]输出:[1,1,2,3,4,4,5,6]解释:链表数组如下:[ 1->4->5, 1->3->4, 2->6]将它们合并到一个有序链表中得到。1->1->2->3->4->4->5->6示例 2:输入:lists = []输

    2022年8月8日
    7
  • Git基础使用教程[通俗易懂]

    Git基础使用教程[通俗易懂]Git是一个开源的分布式版本控制系统,可以有效、高速的处理从很小到非常大的项目版本管理,是目前使用范围最广的版本管理工具。之前的博客中介绍了linux下安装Git的内容,这篇博客,简单介绍下使用Git进行本地文件管理和连接上传远程仓库的方法。。。一、Windows上安装Git一般我们工作的电脑都是Windows系统,要使用git首先要进行安装。从软件管家或者其他平台找到…

    2022年6月6日
    34
  • 电阻和电容的识别_电容电阻怎么区分

    电阻和电容的识别_电容电阻怎么区分一、贴片电阻阻值的读法贴片电阻的阻值通常以数字形式直接标注在电阻的表面,所以读电阻的阻值直接看电阻表面的数字即可。通常情况下有三种表示方法:(1)、由三个数字组成,表明电阻的误差是±5%。前面两位是有效数字,第三位数字表示乘零的倍数,即10的几次方,基本单位是Ω。例如:103,1和0是有效数字直接写下来即可,3表示乘零倍率,也就是10的2次方,所以103表示的阻值就是1010^3=1010…

    2022年8月21日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号