我正在尝试开发一个系统来在语音识别中将垃圾与非垃圾分开。我正在使用隐马尔可夫模型的 jahmm 实现。我对应该将训练数据作为观察序列提供给系统的格式感到困惑。而HMM中的每个状态又是由什么组成的呢?我尝试阅读手册但无法理解。谢谢
最佳答案
I'm confused about the format I should provide the training data to the system as the observation sequence.
要了解格式,您只需阅读源代码即可
public <O extends Observation> Hmm<O>
learn(Hmm<O> initialHmm, List<? extends List<? extends O>> sequences)
表明输入数据必须是观察序列的列表。每个观察序列都是一个观察列表。如果您不明白列表是什么,很好的 CS 入门可以帮助您
And what is each state in the HMM composed of?
HMM 的状态只是数学结构的元素。它们不是由任何东西组成的。它们具有与其相关的概率分布。您可以在HMM tutorial中找到更多详细信息在开始使用 HMM 之前,您应该更好地阅读它。
该库本身也在文档中很好地描述了所有内容:
关于java - 语音识别中 HMM 的观察序列格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16868014/