audio - 操作 MFCC 文件

标签 audio signal-processing data-processing

我有 HTK 从 .wav 文件生成的 MFCC(梅尔频率倒谱系数)文件。我需要的是从 MFCC 中提取时间跨度。当 MFCC 文件表示 90 分钟长度的音频时,我想得到例如MFCC 为音频的第三分钟。

HTK 书中说 MFCC 文件由 header 和连续的样本序列组成。但确定样本的确切大小(以字节为单位)似乎并不简单。

是否有文件解析器? (HTK 中当然有,但我没能弄清楚如何使用二进制文件来完成此任务。)

或者是否有一种简单的方法来确定样本和标题的大小,以便能够简单地将文件分开?

最佳答案

想通了。 HTK 有一个工具可以实现这一点。 HCopy 可以将 MFCC 转换为 MFCC,并接受开始和结束参数。

HCopy -C config0 -s 10e7 -e 11e7 source.mfcc target.mfcc

从源代码中删除 00:10 .. 00:11。

config0 应包含用于从 wav 创建原始 mfcc 的相同配置,但将 sourcekind 设置为 wav 除外。

关于audio - 操作 MFCC 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10103977/

相关文章:

c# - 在C#中使用BASS.NET进行流响度标准化

matlab - 在Matlab中使用卷积对两个不同长度的序列进行互相关

javascript - 用于将下载链接添加到Wordpress默认音频播放器的代码已损坏

gwt - Gwt Sound不起作用?

javascript - Safari 中我的音频循环总是有间隙

algorithm - 跨度快速最小值

makefile - 用于 linux 的免费安全分布式 make 系统

c# - 如何使用C#在ASP.NET背后的代码中访问HTML5音频play()事件

Python DSP,自动增益控制(AGC)

json - 将 JSON 对象传递给 jq 参数