audio - 提取MFCC系数而无需对数？

标签 audio speech-recognition speech mfcc kaldi

我目前正在尝试复制论文的工作，其中他们使用MFCC功能训练了cnn，而没有在最后执行DCT。它基本上是滤波器组能量的对数。

我知道kaldi可以使用make_mfcc.sh脚本来计算MFCC功能。但是是否可以通过某种方式更改脚本以在不执行DCT的情况下计算MFCC，如果没有的话，我是否可以这样做？

MFCC通常如下得出:

进行信号(窗口摘要)的傅立叶变换。

将上面获得的频谱的功率映射到mel刻度上，
使用三角形重叠的窗口。

记录每个梅尔频率下的功率对数。

以梅尔对数幂列表的离散余弦变换为
如果这是一个信号。

MFCC是所得频谱的幅度。

最佳答案

您可以使用make_fbank脚本提取对数能量。

关于audio - 提取MFCC系数而无需对数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42761857/

上一篇：ruby-on-rails - 有没有一种方法可以获取过滤器的点击次数，而无需返回过滤器的所有结果

下一篇：linux - 如何将此 powershell 脚本转换为 bin/sh 脚本？

android - SpeechRecognizer 在第一次收听时抛出 onError

android - TextToSpeech.setLanguage ("en_US") 总是成功吗？

javascript - 如何使用 JavaScript 在浏览器中检测 WebRTC 支持的视频和音频编解码器？

Windows shell : How can I get the audio device(s) name(s)?

javascript - 录制音频..切断

python - 将 TIMIT 数据库中的 Nist Wav 文件读入 python numpy 数组

java - 创建由较小文件组成的声音文件

javascript - x-webkit-speech，如何自动点击麦克风图标自动录制很多单词？

html - 在 HTML/JavaScript 扩展中使用 x-webkit-speech