machine-learning - 卷积神经网络中的旋转等方差?

标签 machine-learning computer-vision neural-network

我想知道CNN的基本架构是否具有旋转等方差性质?我只知道平移等方差,但不确定旋转。

根据我的搜索,旋转等方差可以通过旋转输入图像进行训练来实现。我真的需要这样做吗?旋转度数有多大?为了提供更多上下文,例如,我有一个 CNN,可以在横向模式下检测/读取文本。如果我将图像旋转 90 度/使其纵向,它会得到与原始图像相同的结果/执行相同的结果吗?

最佳答案

您仅在某种程度上具有缩放和旋转不变性 - 究竟多少可能取决于您的设置。您拥有它是因为包含功能的池可能会重叠。

你的提议当然是可能的。您可以随时修改训练数据,添加噪声、旋转、不同比例等来实现该目标。但是,您的模型仍然不是完全旋转不变的。还可以修改网络本身以“正确”完成任务。我确信您偶然发现了Tiled CNNs在你的研究过程中(如果没有,你一定应该阅读那篇论文)。他们使用 TICA 进行预训练,寻找过程中的不变特征。

关于 90° 旋转的最后一个问题:我建议您自己测试一下。如果发生旋转的情况已知(例如在移动设备上),我个人会看看手动将图片旋转回 0°(在将其提供给网络之前)对于给定的约束是否是一个令人满意的解决方案。这是最简单的方法。

关于machine-learning - 卷积神经网络中的旋转等方差?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28201617/

相关文章:

python - 指定 Scikit-learn 中某个误差度量的值越低越好

c - C 中的奇异值分解 (SVD)

neural-network - 为什么我们需要人工神经网络中的层?

machine-learning - 导入 tf.nn.rnn_cell 时出现 Tensorflow 错误

python - 用于 scikit 学习中 10 折交叉验证的混淆矩阵

visual-c++ - 使用opencv缩放空间 Blob 检测

python - 分布式 Tensorflow 中的异步训练如何工作?

python - PyTorch 回归产生与预测相同的数字

迁移网站时匹配重定向 URL 的算法

python - 来自 PIL 图像的 32 位 RGBA numpy 数组