我正在尝试编写一个采用形状张量(None、194、434、626、3)的自动编码器。问题是在 maxpool 之后,尺寸变得奇数,下一个 maxpool 将它们四舍五入。使用上采样进行解码时,我无法使输出维度与输入维度相同。我认为 maxpooling 之前的填充可能会有所帮助,但 tf.pad 不会影响张量。
x = Activation('relu')(x)
print(x.shape)
tf.pad(x, [[0,0],[0,1],[0,1],[0,1],[0,0]], "CONSTANT")
print(x.shape)
encoded = MaxPooling3D(pool_size=(2, 2, 2), padding='same')(x)
print(x.shape)
(?, 97, 217, 313, 8)
(?, 97, 217, 313, 8)
(?, 49, 109, 157, 8)
我做错了什么?解码中上采样的最佳方法是什么?
最佳答案
tf.pad
无法正常工作。您需要分配结果。
x = tf.pad(x, [[0,0],[0,1],[0,1],[0,1],[0,0]], "常量")
关于python - 如何在最大池之前填充特征图?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56697471/