machine-learning - 卷积神经网络中的旋转等方差？

标签 machine-learning computer-vision neural-network

我想知道CNN的基本架构是否具有旋转等方差性质？我只知道平移等方差，但不确定旋转。

根据我的搜索，旋转等方差可以通过旋转输入图像进行训练来实现。我真的需要这样做吗？旋转度数有多大？为了提供更多上下文，例如，我有一个 CNN，可以在横向模式下检测/读取文本。如果我将图像旋转 90 度/使其纵向，它会得到与原始图像相同的结果/执行相同的结果吗？

最佳答案

您仅在某种程度上具有缩放和旋转不变性 - 究竟多少可能取决于您的设置。您拥有它是因为包含功能的池可能会重叠。

你的提议当然是可能的。您可以随时修改训练数据，添加噪声、旋转、不同比例等来实现该目标。但是，您的模型仍然不是完全旋转不变的。还可以修改网络本身以“正确”完成任务。我确信您偶然发现了Tiled CNNs在你的研究过程中(如果没有，你一定应该阅读那篇论文)。他们使用 TICA 进行预训练，寻找过程中的不变特征。

关于 90° 旋转的最后一个问题:我建议您自己测试一下。如果发生旋转的情况已知(例如在移动设备上)，我个人会看看手动将图片旋转回 0°(在将其提供给网络之前)对于给定的约束是否是一个令人满意的解决方案。这是最简单的方法。

关于machine-learning - 卷积神经网络中的旋转等方差？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28201617/

上一篇：R-Caret:如何使用多个模型构建更高效的模型并预测新结果

下一篇：r - 在 R 中使用 depmixS4 拟合 HMM 时出现 NA/NaN/Inf 错误

相关文章：

python - 指定 Scikit-learn 中某个误差度量的值越低越好

c - C 中的奇异值分解 (SVD)

neural-network - 为什么我们需要人工神经网络中的层？

machine-learning - 导入 tf.nn.rnn_cell 时出现 Tensorflow 错误

python - 用于 scikit 学习中 10 折交叉验证的混淆矩阵

visual-c++ - 使用opencv缩放空间 Blob 检测

python - 分布式 Tensorflow 中的异步训练如何工作？

python - PyTorch 回归产生与预测相同的数字

迁移网站时匹配重定向 URL 的算法

python - 来自 PIL 图像的 32 位 RGBA numpy 数组