我正在使用 Hmm 进行单独单词的语音识别。我已经为我的数据库训练了我的 Hmms。我计算并比较传入音频信号的似然概率。我遇到的问题是不同的单词具有不同数量的最佳状态,这将给出不同数量的搜索路径(搜索路径数 = states^observations ),因此无法比较概率。如何标准化不同数量状态的效果?
最佳答案
您需要上下文无关语法或语言模型(通常 - 3-gram 概率模型)来识别话语而不是单个单词。然后,您使用适当的算法来计算每条路径的分数。我强烈建议您查看现有的解决方案,例如 Kaldi或CMUSphinx .
关于machine-learning - 使用 HMM 进行语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21029088/