python - 图书馆 : MFCC feature calculation

标签 python audio audio-processing mfcc

给定一个音频文件 22 mins (1320 secs) ,Librosa 通过以下方式提取 MFCC 特征 data = librosa.feature.mfcc(y=None, sr=22050, S=None, n_mfcc=20, **kwargs)

data.shape (20,56829) It returns numpy array of 20 MFCC features of 56829 frames .

我的问题是它是如何计算出56829的。是否有任何计算可以实现这个框架?每个框架的窗口大小是多少?

最佳答案

您可以指定跃点长度

mfcc = librosa.feature.mfcc(y=y, sr=sr, hop_length=hop_length, n_mfcc=13)

librosa 使用居中帧,因此第 k 帧以样本 k * hop_length 为中心

我认为默认跃点值为 512,您的数据为 (1320*22050)/56829 = 512,16

关于python - 图书馆 : MFCC feature calculation,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38149210/

相关文章:

matlab - 在Matlab中将LFO应用于信号

python-3.x - 音频 .wav 文件的二进制分类

python - 在Python中循环无限嵌套字典

python - 迭代 sqlalchemy 的查询结果

Python:如何使用必须引用其容器的元素设计容器

ios - XCODE/IOS-通过直接打开将音频文件共享到whatsapp

matlab - Matlab中如何将声音转换为矩阵?

python - 如何合并两个表以在 peewee 中选择分页数据?

javascript - 在 PDF 中播放声音

ios - 如何使 VLCMediaPlayer 静音