我能够读取wav文件及其值。我需要找到峰和坑的位置及其值。第一次,我尝试通过(i-1 + i + i +1) / 3
公式对其进行平滑处理,然后以array[i-1] > array[i] & direction == 'up' --> pits
样式解决方案在数组上进行搜索,但是由于噪声和项目 future 计算的其他原因,我试图找到更好的工作区域。几天以来,我一直在研究FFT。据我了解,ftf将音频文件转换为一系列的正弦和余弦。 fft操作后,给定值是a0
的a1
和a0 + ak * cos(k*x) + bk * sin(k*x) which k++ and x++
,如图所示
http://zone.ni.com/images/reference/en-XX/help/371361E-01/loc_eps_sigadd3freqcomp.gif
我的问题是,fft是否有助于我找到音频的峰值和凹点?有人对这种问题有经验吗?
最佳答案
这完全取决于您要执行的操作,而您尚未真正弄清楚。 “找到高峰和低谷”是一回事,但是由于执行此操作的原因可能多种多样,因此可能会有多种方法。您已经尝试了直接寻找局部最大值和最小值的简单方法,这听起来像是。这里有一些提示:
关于signal-processing - 是否需要FFT才能找到音频文件上的峰值和凹坑,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11312703/