java - 语音识别中 HMM 的观察序列格式

我正在尝试开发一个系统来在语音识别中将垃圾与非垃圾分开。我正在使用隐马尔可夫模型的 jahmm 实现。我对应该将训练数据作为观察序列提供给系统的格式感到困惑。而HMM中的每个状态又是由什么组成的呢？我尝试阅读手册但无法理解。谢谢

最佳答案

I'm confused about the format I should provide the training data to the system as the observation sequence.

要了解格式，您只需阅读源代码即可

public <O extends Observation> Hmm<O>
    learn(Hmm<O> initialHmm, List<? extends List<? extends O>> sequences)

表明输入数据必须是观察序列的列表。每个观察序列都是一个观察列表。如果您不明白列表是什么，很好的 CS 入门可以帮助您

And what is each state in the HMM composed of?

HMM 的状态只是数学结构的元素。它们不是由任何东西组成的。它们具有与其相关的概率分布。您可以在HMM tutorial中找到更多详细信息在开始使用 HMM 之前，您应该更好地阅读它。

该库本身也在文档中很好地描述了所有内容:

关于java - 语音识别中 HMM 的观察序列格式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16868014/

相关文章：

python - 如何在没有相位跳跃的情况下连接正弦波