python - 应用傅立叶变换后 scipy.io 波形文件处理的问题

标签 python scipy fft wav wave

我正在使用 scipy.fftpack 和 scipy.io 包在 Python 中处理一些音频文件。这意味着我正在导入波形文件,使用傅立叶变换处理它们,然后输出到新的波形文件。然而,我遇到了一些问题,在运行这些转换后,波形文件将无法播放,并且大约是原始文件大小的 4 倍。

目前我只是导入歌曲,从导入中获取速率和数据片段,执行 ifft(fft(data)) 然后输出。我尝试获取这些浮点值并将其转换为整数,并计算初始导入数据和 ifft(fft(data)) 之间的差异,发现它恰好为零。

以下是我的问题:

  1. 有人知道为什么我在进行傅立叶变换后尝试播放的波形文件无法播放吗?

  2. 波形文件是否存在任何可能导致一般问题的限制。或者数据必须是整数吗?

已经很晚了,我觉得我的帖子可能比较分散,所以如果您需要更多信息,请询问,我会尽力提供更好的描述。

最佳答案

处理后您需要将数据转换为适当位深度的整数类型。使用this file举个例子:

>>> import scipy.io.wavfile
>>> rate, data = scipy.io.wavfile.read('Happy Tree Friends.wav')
>>> rate
8000
>>> data
array([ 5, -5,  5, ...,  0, -1,  0], dtype=int16)
>>> data_bis = np.fft.ifft(np.fft.fft(data))
>>> data_bis
array([  5.00000000e+00 -1.55406753e-11j,
        -5.00000000e+00 +1.95349676e-11j,
         5.00000000e+00 +1.41131140e-11j, ...,
         8.06674092e-12 -7.58643463e-13j,
        -1.00000000e+00 -2.21611283e-12j,  -2.04999489e-11 +4.55890751e-12j])
>>> data_bis.dtype
dtype('complex128')

尽管 data 中的值非常接近 data_bis 中的值,但它们是非常不同的野兽,如下所示:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis)
>>> scipy.io.wavfile.read('test.wav')
TypeError: data type not understood

但是,如果您只需将处理后的结果转换回原始dtype,一切都会再次正常运行:

>>> scipy.io.wavfile.write('test.wav', rate, data_bis.astype(data.dtype))
__main__:1: ComplexWarning: Casting complex values to real discards the imaginary part
>>> scipy.io.wavfile.read('test.wav')
(8000, array([ 4, -5,  4, ...,  0, -1,  0], dtype=int16))

关于python - 应用傅立叶变换后 scipy.io 波形文件处理的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15595928/

相关文章:

python - 从数组创建 mpf

python - 从 PubChem FTP 数据生成分子的二维图像

c - 如何在 C 中使用 FFTW 从 PortAudio 的样本中提取频率信息

signal-processing - 倍频程:不正确的 FFT 相位谱

python - Python如何打印每一行处理代码?

python - 带文件旋转器的全局 Python 记录器

python - 在 Python 中使用的高级邮件

python - 是否可以使用 pandas dataframe 或任何其他方式插入日期而不考虑闰年 2 月 29 日?

python - 当我们只向 kmeans 提供单个单词的 tfidf 向量时,kmeans 如何知道如何对文档进行聚类?

python - 科学 : fourier transform of a few selected frequencies