machine-learning - 使用 HMM 进行语音识别

标签 machine-learning artificial-intelligence speech-recognition speech-to-text hidden-markov-models

我正在使用 Hmm 进行单独单词的语音识别。我已经为我的数据库训练了我的 Hmms。我计算并比较传入音频信号的似然概率。我遇到的问题是不同的单词具有不同数量的最佳状态，这将给出不同数量的搜索路径(搜索路径数 = states^observations )，因此无法比较概率。如何标准化不同数量状态的效果？

最佳答案

您需要上下文无关语法或语言模型(通常 - 3-gram 概率模型)来识别话语而不是单个单词。然后，您使用适当的算法来计算每条路径的分数。我强烈建议您查看现有的解决方案，例如 Kaldi或CMUSphinx .

关于machine-learning - 使用 HMM 进行语音识别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21029088/

上一篇：python - 为什么使用 scikit-learn 的 GradientBoostingRegressor 从相同的输入中得到不同的输出？

下一篇：machine-learning - 神经网络中不同类别的不同权重以及学习后如何使用它们

相关文章：

android - 哈萨克语移动语音识别

java - Encog - 如何为神经网络加载训练数据

java - 使用斯坦福解析器解析凌乱的文本

machine-learning - 乒乓球机器人神经网络的建议

python - 构建多个输出的神经网络

java - 检查三角形阵列中的邻接

java - 将视频或音频转换为文本而不播放？

matlab - G和GHAT需要是相同的分类树

machine-learning - 径向基函数网络(RBF网络)

signal-processing - 如何使用 Octave 获得 mfcc 功能