python - MFCC采样频率

标签 python numpy audio scipy scikit-learn

我想获取我的wav文件的MFCC值。这是我的代码:

> import numpy as np 
> import scipy.io.wavfile 
> from scikits.talkbox.features import mfcc
> sr1,x1=scipy.io.wavfile.read("filename.wav")
> ceps1,mspec1,spec1=mfcc(x1)

sr1的值= 22050。但是在scikit.talkbox库中,mfcc()使用fs = 16000作为默认值。我该如何解决?或对我有什么问题吗?

最佳答案

看看the docstring for mfcc 。该函数的签名是

def mfcc(input, nwin=256, nfft=512, fs=16000, nceps=13):

正如您在问题中指出的那样,fs的默认值为16000。您可以在代码中使用fs=sr1覆盖它的默认值:
ceps1, mspec1, spec1 = mfcc(x1, fs=sr1)

(有关python函数的关键字参数的更多信息,请参见4.7.2. Keyword Arguments in the python tutorial。)

关于python - MFCC采样频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42507589/

相关文章:

Python sklearn RandomForestClassifier 不可重现的结果

python - Numpy PIL Python : crop image on whitespace or crop text with histogram Thresholds

python - 如何连接 pandas.DataFrames 列

python - 如何对 google 进行 OAuth2 风格身份验证,无需用户交互(以替换废弃的 gdata.docs.client.DocsClient API)

python : Convert list of tuple to dict

python - 如何向此 Youtube 数据 API 请求添加 API key ?

python - Numba nopython 模式的三对角矩阵算法

node.js - 从 Node.js 上的 Web Audio API 播放 PCM 流

c# - 如何将 WAVE_MAPPER 音频线与其音频设备关联

audio - 较新版本的 JRE 不加载音库,但旧版本会加载