转置卷积详解

转置卷积详解转置卷积详解  前面文章对卷积做了讲解,感觉既然重新整理,就将系列概念整体做个梳理,也算是将自己知道的所有东西拿来献丑把。  转置卷积(TransposedConvolution)是后来的叫法,一开始大家都是称逆卷积/反卷积(Deconvolution),这个概念是在图像分割任务中被提出来的,图像分割需要逐像素的操作,对每一个像素做一个分割,将其归类到不同的物体当中。  这个任务大家很自然…

大家好,又见面了,我是你们的朋友全栈君。

转置卷积详解

  前面文章对卷积做了讲解,感觉既然重新整理,就将系列概念整体做个梳理,也算是将自己知道的所有东西拿来献丑把。
  转置卷积(Transposed Convolution)是后来的叫法,一开始大家都是称逆卷积/反卷积(Deconvolution),这个概念是在图像分割任务中被提出来的,图像分割需要逐像素的操作,对每一个像素做一个分割,将其归类到不同的物体当中。
  这个任务大家很自然的想要使用卷积神经网络来完成,那就得先使用卷积神经网络提取特征,但是卷积神经网络中的两大主要构件,卷积层和下采样层会使得图像的尺寸不断缩小。这个就与逐像素的分类不符,因为逐像素分割的话是需要输出和输入大小是一致的。
  针对这个问题,有人提出了先使用卷积核下采样层逐层的提取特征,然后通过上采样再将特征图逐渐的恢复到原图的尺寸。而这个上采样一开始就是通过反卷积来实现的。如果说卷积核下采样的过程特征图是变小的,那么上采样之后特征图应该变大。
  我们应该熟悉卷积的输出尺寸公式 o u t = ( F − K + 2 P ) / s + 1 out=(F-K+2P)/s+1 out=(FK+2P)/s+1,其中F表示输入特征图的尺寸,K表示卷积核的尺寸,P表示padding,S表示卷积的步长。我们都通过这个公式来计算卷积的输出特征图尺寸。举例来说明,一个4×4的输入特征图,卷积核为3×3,如果不使用paddng,步长为1,则带入计算 o u t = ( 4 − 3 ) / 1 + 1 out=(4-3)/1+1 out=(43)/1+1为2。
  我们已经在im2col算法的介绍中讲解了卷积的实现,实际上这个步骤是通过两个矩阵的乘法来完成的,我们不妨记为 y = C x y=Cx y=Cx,如果要上采样,我们希望给输出特征图乘一个参数矩阵,然后把尺寸还原回去,根据数学知识,我们给特征图矩阵 y y y左乘一个{C^T},就能得到 C T y = C T C x C^Ty=C^TCx CTy=CTCx C C C的列数等于 x x x的行数, C T C C^TC CTC的行数和列数都等于x的行数,乘完之后,得到的结果与 x x x形状相同。这就是转置卷积名字的来源。有一些工作确实是这样实现的。
  我们也能很自然的得出结论,我们不需要给输出特征图左乘 C T C^T CT,显然只要和这个矩阵形状相同,输出的结果就和原特征图尺寸相同,而且这个操作同样可以使用卷积来实现,那我们只要保证形状一致,然后参数我们可以自己训练,这样尺寸的问题解决了,而且特征的对应也有了,是可以训练的,一举两得。
  im2col讲解的内容,卷积是 ( C o u t , C i n ∗ K h ∗ K w ) (C_{out},C_{in}*K_h*K_w) (Cout,CinKhKw)的卷积核乘 ( C i n ∗ K h ∗ K w , H N ∗ W N ) (C_{in}*K_h*K_w,H_N*W_N) (CinKhKw,HNWN)的特征图,得到 ( C o u t , H N ∗ W N ) (C_{out},H_N*W_N) (Cout,HNWN)的结果。现在对卷积核做一个转置 ( C i n ∗ K h ∗ K w , C o u t ) (C_{in}*K_h*K_w,C_{out}) (CinKhKw,Cout) ( C o u t , H N ∗ W N ) (C_{out},H_N*W_N) (Cout,HNWN)得到一个 ( C i n ∗ K h ∗ K w , H N ∗ W N ) (C_{in}*K_h*K_w,H_N*W_N) (CinKhKw,HNWN)的特征图。
  除了以上内容这里还有一点其他需要补充的东西,比如在caffe中除了im2col函数之外,还有一个函数是col2im,也就是im2col的逆运算。所以对于上面的结果caffe是通过col2im来转换成特征图的。但是col2im函数对于im2col只是形状上的逆函数,事实上,如果对于一个特征图先执行im2col再执行col2im得到的结果和原来是不相等的。
  而在tensorflow和pytorch中,这一点是有差异的,两者是基于特征图膨胀实现的转置卷积操作,两者是是通过填充来进行特征图膨胀的,之后可能还会有一个crop操作。之所以需要填充,是因为想要直接通过卷积操作来实现转置卷积,干脆填充一些值,这样卷积出来的特征图尺寸自然就更大。
  但是两者从运算上来讲都无法对原卷积进行复原,只是进行了形状复原而已。
  到了最后就可以讨论形状的计算了,转置卷积是卷积的形状逆操作,所以形状计算就是原来计算方式的逆函数。 o u t = ( F − K + 2 P ) / s + 1 out=(F-K+2P)/s+1 out=(FK+2P)/s+1这个函数的逆函数反解一下,其中mod是上公式除s的余数。
在这里插入图片描述
  就是通过这个公式来计算反卷积的输出,因为mod是除s得到的余数,也就是说mod是小于s的,当s=1的时候只能为0,一个解,当 s > 1 s>1 s>1时,就会有多个解,这个时候,指定了好参数之后,pytorch和tensorflow就会对特征图四周进行填充,然后再做卷积。这个公式里有一个乘s,这个怎么实现,就是对特征图进行膨胀的操作。在特征图两个cell之间,填充上s-1个值,膨胀之后特征图就会变成 ( o u t − 1 ) s + 1 (out-1)s+1 (out1)s+1,这个时候还需要根据mod来进行外部的填充。做一个卷积,然后事实上这里还会继续根据特征图的输出尺寸做填充,这个计算就更加复杂一些,但是我的目的主要是为了把膨胀这里讲的通透,下面用一张图来说明这种膨胀,如下图是s=2的膨胀。
特征图膨胀示意图
  大家可以自行把这个公式和tf或者pytroch的接口的参数对应上,因为我不想讲接口,所以这里不赘述。为了进一步方便理解,我还画了下面一张图。
操作解析

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/151928.html原文链接:https://javaforall.net

(0)
上一篇 2022年6月21日 上午11:36
下一篇 2022年6月21日 上午11:36


相关推荐

  • linux 删除 软连接(shell创建软连接)

    语法ln(选项)源文件目标文件1、区分符号连接“源文件”可以是文件或者目录硬连接,“源文件”参数只能是文件2、创建软链接ln–s/source/target参数:-s或——symbolic:对源文件建立符号连接,而非硬连接;3、删除软连接rm–rf/target注意:不要在后文件名后面加斜杆“/”否则会删除文件夹的内容参考:ht…

    2022年4月14日
    1.5K
  • 音视频的数字化原理「建议收藏」

    今天本写了篇dicom医学图像解析的文章,后面听人谈到了音视频,今天我就再从中学物理写下我理解的音视频数字化原理。**音频:**物理上说声音三要素音调,响度,音色,响度直观理解就是声音的大小,声音的高低(高音、低音),音色,又称音品这两个其实都跟频率有关。声音的数字化呢,其实来源于原理的,物理上人能听到声音频率的范围是20hz到20khz,数字化采集声音时一般时按44.1khz采集的,就是1s中采集44100次,然后用16byte2个字节来存,一个采样能存的层级就是-2的8次方到2的8次方-1层,总的就是

    2022年4月9日
    50
  • win10多合一原版系统_win10多合一原版系统[通俗易懂]

    win10多合一原版系统_win10多合一原版系统[通俗易懂]win10多合一原版系统装机系统拥有着大多数同类型定位的装机系统所没有的强大稳定性可以确保系统在运行的过程中绝对不会因为一些小毛病而出现崩溃的现象,对win10多合一原版系统装机系统感兴趣的朋友们快下载吧。win10多合一原版系统介绍:1、在不影响大多数软件和硬件操作的情况下,尽可能关闭不必要的服务。2、电脑兼容通用驱动助手,可以智能判断硬件类型并安装最兼容的驱动。3、综合2000-2020年流行…

    2022年6月16日
    88
  • c++——内存池介绍

    c++——内存池介绍1 默认内存管理函数的不足利用默认的内存管理操作符 new delete 和函数 malloc free 在堆上分配和释放内存会有一些额外的开销 系统在接收到分配一定大小内存的请求时 首先查找内部维护的内存空闲块表 并且需要根据一定的算法 例如分配最先找到的不小于申请大小的内存块给请求者 或者分配最适于申请大小的内存块 或者分配最大空闲的内存块等 找到合适大小的空闲内存块 如果该空闲内存块过大 还需要切割成已分配的部分和较小的空闲块 然后系统更新内存空闲块表 完成一次内存分配 类似地 在释放内存时

    2026年3月17日
    2
  • 云服务器怎么设置成代理服务器?

    云服务器怎么设置成代理服务器?我的云服务器本来是作为Web服务器用的。但是现在有个问题我们财务的软件,数据在联通的服务器上存放着,而我们单位的网络是移动的网络,两个连起来费劲的很,也就是软件使用起来费劲的很。我想通过云服务器中转,因为我们上云服务器速度挺快,云服务器上联通的应该也挺快的。高手知道怎么搞嘛?就像网上很多http、socks代理一样,把我的服务器变…

    2022年6月22日
    74
  • Spring RestTemplate中几种常见的请求方式

    Spring RestTemplate中几种常见的请求方式在 SpringCloud 中服务的发现与消费一文中 当我们从服务消费端去调用服务提供者的服务的时候 使用了一个很好用的对象 叫做 RestTemplate 当时我们只使用了 RestTemplate 中最简单的一个功能 getForEntity 发起了一个 get 请求去调用服务端的数据 同时 我们还通过配置 LoadBalanced 注解开启客户端负载均衡 RestTemplate 的功能不可谓不强大 那么今天我

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号