我的目标是获得具有图像空间频率的图 - 有点像对其进行傅立叶变换。我不关心频率为 f 的特征在图像上的位置(例如);我只想要一个图形,告诉我每个频率有多少(频带的振幅可以用与该频率的对比度之和来表示)。
我正在尝试通过 numpy.fft.fft2
来做到这一点功能。
这里是一个链接 minimal example描述我的用例。
事实证明,我只得到明显更大的 frequencies[:30,:30]
值,其中绝对最高值是 frequencies[0,0]
。我该如何解释呢?
- 每个值的幅度究竟代表什么?
- 我的最高值在
frequency[0,0]
中是什么意思什么是0 Hz
频率? - 我能否以某种方式对这些值进行分类,以便我的频谱与方向无关?
最佳答案
freq
有一些非常大的值,还有很多小值。你可以通过绘图看到这一点
plt.hist(freq.ravel(), bins=100)
(见下文。)因此,当您使用
ax1.imshow(freq, interpolation="none")
Matplotlib 使用 freq.min()
作为颜色范围内的最低值(默认为蓝色),freq.max()
作为最高值颜色范围内的值(默认情况下为红色)。由于 freq
中的几乎所有值都靠近蓝色端,因此整个图看起来是蓝色的。
您可以通过重新调整 freq
中的值来获得更多信息,以便低值在颜色范围内分布更广泛。
例如,您可以通过获取freq
的log
来获得更好的值分布。 (您可能不想丢弃最高值,因为它们对应于具有最高功率的频率。)
import matplotlib as ml
import matplotlib.pyplot as plt
import numpy as np
import Image
file_path = "data"
image = np.asarray(Image.open(file_path).convert('L'))
freq = np.fft.fft2(image)
freq = np.abs(freq)
fig, ax = plt.subplots(nrows=2, ncols=2, figsize=(14, 6))
ax[0,0].hist(freq.ravel(), bins=100)
ax[0,0].set_title('hist(freq)')
ax[0,1].hist(np.log(freq).ravel(), bins=100)
ax[0,1].set_title('hist(log(freq))')
ax[1,0].imshow(np.log(freq), interpolation="none")
ax[1,0].set_title('log(freq)')
ax[1,1].imshow(image, interpolation="none")
plt.show()
来自 the docs :
The output, analogously to fft, contains the term for zero frequency in the low-order corner of the transformed axes,
因此,freq[0,0]
是“零频率”项。换句话说,它是 discrete Fourier Transform 中的常数项。 .
关于python - 解释 numpy.fft.fft2 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21362843/