machine-learning - 深度学习中CNN的窗口大小如何选择?

标签 machine-learning deep-learning conv-neural-network data-science hyperparameters

在卷积神经网络(CNN)中,选择一个滤波器来共享权重。例如,在下图中,选择了步长(相邻神经元之间的距离)为1的3x3窗口。

所以我的问题是:如何选择窗口大小?如果我使用4x4,步幅为2,会造成多大的差异?预先非常感谢!

最佳答案

对此没有明确的答案:过滤器大小是您通常需要调整的超参数之一。不过,有一些有用的观察结果可能会对您有所帮助。通常首选选择较小的过滤器,但拥有更多数量的过滤器。

示例:四个 5x5 过滤器有 100 个参数(忽略偏差),而 10 个 3x3 过滤器有 90 个参数。通过较大的过滤器,您仍然可以捕获图像中的各种特征,但参数较少。更多关于此here .

现代 CNN 更进一步地继承了这个想法,并选择连续的 3x11x3 卷积层。这进一步减少了参数数量,但不影响性能。请参阅evolution of inception network .

步幅的选择也很重要,但它会影响卷积后的张量形状,从而影响整个网络。一般规则是在通常的卷积中使用 stride=1 并通过填充保留空间大小,并在想要对图像进行下采样时使用 stride=2

关于machine-learning - 深度学习中CNN的窗口大小如何选择?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47029417/

相关文章:

machine-learning - 估计人工神经网络的神经元数量和层数

machine-learning - 为什么姿态估计器这么慢?

neural-network - Keras 密集层错误 : TypeError: 'int' object is not callable

machine-learning - 学习率、损失和批量大小

python - 我的 PyTorch 转发函数可以执行其他操作吗?

python - 损失函数增加而不是减少

python - 交叉熵损失突然增加到无穷大

r - 在 R 的 GLMNET 包中预测拟合模型时出现问题

python - 不平衡数据和加权交叉熵

python - 在用于图像分割的全卷积神经网络中将Python中的索引值转换为(R,G,B)值(颜色图)