转置卷积
基本思想
标准卷积将输入特征图“压缩”或保持尺寸(取决于 padding 和 stride),而转置卷积则试图“扩展”特征图的空间维度,即从低分辨率特征图重建高分辨率输出。
转置卷积并不是卷积的数学逆运算,而是卷积操作的前向传播过程的矩阵转置形式,因此得名“转置卷积”。
更直观的理解是:标准卷积把大尺寸特征图映射到小尺寸特征图(下采样),而转置卷积则尝试把小尺寸特征图映射到大尺寸特征图(上采样)。
工作原理
输入特征图:一个 2x2 的矩阵。
卷积核:使用一个 2x2 的卷积核。
关键步骤 - 插值(膨胀输入):
- 在输入的每个元素之间和周围插入零值。插入多少零由步长(
stride)决定。 - 对于步长
s=1的普通卷积,其对应的转置卷积的零填充方式是:在每个输入元素之间插入(s-1)=0个零,在周围填充(kernel_size - 1)个零。
- 在输入的每个元素之间和周围插入零值。插入多少零由步长(

理解
卷积不会增大输入的高宽,通常要么不变、要么减半
转置卷积则可以用来增大输入高宽
转置由来
对于卷积
Y = X * W可以对 W 构造一个 V,使得卷积等价于矩阵乘法
这里 Y′, X′是 Y, X对应的向量版本
转置卷积则等价于
如果卷积将输入从(h,w)变成了 (h′,w′)
- 同样超参数的转置卷积则从 (h′,w′)变成(h,w)
