CNN 网络中的参数计算

卷积层（Convolutional Layer, CONV-K-N）

功能：提取局部特征。

符号含义：

输出维度：

$H_{\text{out}} = \frac{H_{\text{in}} - K + 2P}{S} + 1, \quad W_{\text{out}} = \frac{W_{\text{in}} - K + 2P}{S} + 1, \quad C_{out} = N$

计算时向下取整，可以想象滑动窗口滑到最后一步时，还剩余一部分无法卷积。

same模式：当 $P=(K-1)/2$ 时，$H_{\text{out}}=H_{\text{in}}/S$，结果向上取整，注意此时 $K$ 必须为奇数。Pytorch 中当 $S=1$ 时可指定 padding='same' 以保证图片尺寸不变。

参数数量：

$\text{weights} = K \times K \times C_{\text{out}} \times C_{\text{in}}, \quad \text{bias} = C_{\text{out}}$

功能：反卷积层用于在卷积操作的基础上执行空间维度的上采样，恢复特征图的分辨率，同时保留原始的局部特征。它被广泛应用于生成式模型（如 GANs）、图像重建（如去噪）以及语义分割任务中。

符号含义：

输出维度：

$H_{\text{out}} = S \cdot (H_{\text{in}} - 1) - 2P + K + O, \quad W_{\text{out}} = S \cdot (W_{\text{in}} - 1) - 2P + K + O$

其中 $O$ 是输出填充，用于微调输出尺寸。

same模式：当 $P=(K-1)/2$ 且 $O=S-1$ 时，$H_{\text{out}}=H_{\text{in}} \times S$。当 $S\ne 1$ 时，以 same 模式做卷积和反卷积后，图片尺寸可能变化，这是因为卷积时图片尺寸不能整除 $S$，此时需要微调 $O$。

参数数量：反卷积层的参数数量与标准卷积层相同：

$\text{weights} = K \times K \times C_{\text{out}} \times C_{\text{in}}, \quad \text{bias} = C_{\text{out}}$

$H_{\text{out}} = \frac{H_{\text{in}}}{K}, \quad W_{\text{out}} = \frac{W_{\text{in}}}{K}, \quad C_{out} = C_{in}$

同样向下取整。

$\text{weights} = 0, \quad \text{bias} = 0$

$\text{Output} = O$

根据实际分类需求而定。

$\text{weights} = I \times O, \quad \text{bias} = O$

$\text{weights}$ 是一个输入到输出的线性变换矩阵，$\text{bias}$ 是和输出维度相同的偏置。