python - 从图像中减去均值

标签 python image-processing machine-learning neural-network

我正在使用 Theano 实现 CNN。在论文中,我必须在训练 CNN 之前进行图像预处理

We extracted RGB patches of 61x61 dimensions associated with each poselet activation, subtracted the mean and used this data to train the convnet model shown in Table 1

你能告诉我“减去平均值”是什么意思吗?告诉我这些步骤是否正确(这是我的理解) 1) 计算整个图像的红色 channel 、绿色 channel 和蓝色 channel 的平均值 2)对于每个像素,从红色值中减去红色 channel 的平均值,从绿色值中减去绿色 channel 的平均值,蓝色 channel 也相同 3) 负值是否正确,还是我使用了 abs?

谢谢大家!!

最佳答案

你应该仔细阅读论文,但最有可能的是它们的意思是补丁的平均值,所以你有N个矩阵61x61 像素,相当于长度为 61^2 的向量(如果有三个 channel 则 3*61^2)。他们所做的 - 他们简单地计算每个维度的平均值,因此他们计算关于每个 3*61^2 维度的这些 N 向量的平均值。结果,他们获得了长度为 3*61^2平均向量(或平均矩阵/平均补丁如果你愿意的话),他们会从所有这些 N 补丁中减去它。生成的补丁将具有负值,这很好,你不应该取 abs 值,神经网络更喜欢这种数据。

关于python - 从图像中减去均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29743523/

相关文章:

python - fork 图 python - 没有图像?

c# - 为什么 Python.NET 使用基方法而不是派生类中的方法?

java - 比较图像以查找重复项

machine-learning - 序列模型 Word2vec

language-agnostic - 关于在谷歌地图中识别陆地/海洋质量的技术建议

python - python 中的 asyncore.dispatcher : when are the handle_closed and handle_read executed?

python - tensorflow 值错误: Too many vaues to unpack (expected 2)

python - 如何将掩码应用于维持形状和检索值的 numpy 数组?

image-processing - 如何在图像卷积过程中使用预乘来解决 alpha bleed 问题?

machine-learning - 在长序列上训练 RNN