我正在使用 scipy.fftpack 和 scipy.io 包在 Python 中处理一些音频文件。这意味着我正在导入波形文件,使用傅立叶变换处理它们,然后输出到新的波形文件。然而,我遇到了一些问题,在运行这些转换后,波形文件将无法播放,并且大约是原始文件大小的 4 倍。
目前我只是导入歌曲,从导入中获取速率和数据片段,执行 ifft(fft(data)) 然后输出。我尝试获取这些浮点值并将其转换为整数,并计算初始导入数据和 ifft(fft(data)) 之间的差异,发现它恰好为零。
以下是我的问题:
有人知道为什么我在进行傅立叶变换后尝试播放的波形文件无法播放吗?
波形文件是否存在任何可能导致一般问题的限制。或者数据必须是整数吗?
已经很晚了,我觉得我的帖子可能比较分散,所以如果您需要更多信息,请询问,我会尽力提供更好的描述。
最佳答案
处理后您需要将数据转换为适当位深度的整数类型。使用this file举个例子:
>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('Happy Tree Friends.wav')
>>> rate
8000
>>> data
array([ 5, -5, 5, ..., 0, -1, 0], dtype=int16)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([ 5.00000000e+00 -1.55406753e-11j,
-5.00000000e+00 +1.95349676e-11j,
5.00000000e+00 +1.41131140e-11j, ...,
8.06674092e-12 -7.58643463e-13j,
-1.00000000e+00 -2.21611283e-12j, -2.04999489e-11 +4.55890751e-12j])
>>> data_bis.dtype
dtype('complex128')
尽管 data
中的值非常接近 data_bis
中的值,但它们是非常不同的野兽,如下所示:
>>> scipy.io.wavfile.write('test.wav', rate, data_bis)
>>> scipy.io.wavfile.read('test.wav')
TypeError: data type not understood
但是,如果您只需将处理后的结果转换回原始dtype
,一切都会再次正常运行:
>>> scipy.io.wavfile.write('test.wav', rate, data_bis.astype(data.dtype))
__main__:1: ComplexWarning: Casting complex values to real discards the imaginary part
>>> scipy.io.wavfile.read('test.wav')
(8000, array([ 4, -5, 4, ..., 0, -1, 0], dtype=int16))
关于python - 应用傅立叶变换后 scipy.io 波形文件处理的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15595928/