audio - 提取MFCC系数而无需对数?

标签 audio speech-recognition speech mfcc kaldi

我目前正在尝试复制论文的工作,其中他们使用MFCC功能训练了cnn,而没有在最后执行DCT。它基本上是滤波器组能量的对数。

我知道kaldi可以使用make_mfcc.sh脚本来计算MFCC功能。但是是否可以通过某种方式更改脚本以在不执行DCT的情况下计算MFCC,如果没有的话,我是否可以这样做?

MFCC通常如下得出:

进行信号(窗口摘要)的傅立叶变换。

  • 将上面获得的频谱的功率映射到mel刻度上,
    使用三角形重叠的窗口。
  • 记录每个梅尔频率下的功率对数。
  • 以梅尔对数幂列表的离散余弦变换为
    如果这是一个信号。
  • MFCC是所得频谱的幅度。
  • 最佳答案

    您可以使用make_fbank脚本提取对数能量。

    关于audio - 提取MFCC系数而无需对数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42761857/

    相关文章:

    android - 语音识别(语音转文本)在 android 4.2.2 中不起作用

    android - SpeechRecognizer 在第一次收听时抛出 onError

    android - TextToSpeech.setLanguage ("en_US") 总是成功吗?

    javascript - 如何使用 JavaScript 在浏览器中检测 WebRTC 支持的视频和音频编解码器?

    Windows shell : How can I get the audio device(s) name(s)?

    javascript - 录制音频..切断

    python - 将 TIMIT 数据库中的 Nist Wav 文件读入 python numpy 数组

    java - 创建由较小文件组成的声音文件

    javascript - x-webkit-speech,如何自动点击麦克风图标自动录制很多单词?

    html - 在 HTML/JavaScript 扩展中使用 x-webkit-speech