维基百科说你不知道第一个状态是什么,所以你必须在先验状态向量中为每个状态分配相同的概率。但你确实知道转移概率矩阵是什么,并且该矩阵的特征值为 1 的特征向量是 HMM 中每个状态的频率(我认为),所以你为什么不使用该向量作为先验向量状态向量代替?
最佳答案
这实际上是一个建模决策。你的建议当然是可能的,因为它几乎对应于在观察结果上加上大量的观察结果,其中隐藏状态根本没有被观察到或没有任何影响——这将给原始状态带来稳定到平衡的时间分布。
但是,如果您有一系列以分隔开头的观察结果,例如在说话者开始时开始的一段语音,或在句子开头开始的一段文本,则没有特别的理由相信第一个状态的分布与平衡分布相同:我非常怀疑“e”是否是句子开头最常见的字符,而众所周知它是英语文本中最常见的字符.
您选择什么可能并不重要,除非您正在一起处理大量非常短的观察序列。大多数时候,我只会担心是否要将其中一个状态概率设置为零,因为经常用于优化 HMM 参数的 EM 算法或 Baum-Welch 算法可能不愿意重新估计远离零的参数。
关于algorithm - 为什么前向-后向算法中的先验状态向量不是特征值为1的转移矩阵的特征向量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11620588/