machine-learning - 使用 HMM 进行语音识别

标签 machine-learning artificial-intelligence speech-recognition speech-to-text hidden-markov-models

我正在使用 Hmm 进行单独单词的语音识别。我已经为我的数据库训练了我的 Hmms。我计算并比较传入音频信号的似然概率。我遇到的问题是不同的单词具有不同数量的最佳状态,这将给出不同数量的搜索路径(搜索路径数 = states^observations ),因此无法比较概率。如何标准化不同数量状态的效果?

最佳答案

您需要上下文无关语法或语言模型(通常 - 3-gram 概率模型)来识别话语而不是单个单词。然后,您使用适当的算法来计算每条路径的分数。我强烈建议您查看现有的解决方案,例如 KaldiCMUSphinx .

关于machine-learning - 使用 HMM 进行语音识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21029088/

相关文章:

android - 哈萨克语移动语音识别

java - Encog - 如何为神经网络加载训练数据

java - 使用斯坦福解析器解析凌乱的文本

machine-learning - 乒乓球机器人神经网络的建议

python - 构建多个输出的神经网络

java - 检查三角形阵列中的邻接

java - 将视频或音频转换为文本而不播放?

matlab - G和GHAT需要是相同的分类树

machine-learning - 径向基函数网络(RBF网络)

signal-processing - 如何使用 Octave 获得 mfcc 功能