我有一个时间序列数据集作为一个包含以下列的 csv 文件-
ID,TIMESTAMP,MEASUREMENTS[10]
对于一个 ID,有多个测量值以及进行这些测量值时的相关时间戳。列测量值包含 10 个测量值的列表。一条记录(与特定时间戳相关联)中的测量在某种程度上取决于前一条记录。
例如。数据集:
ID,TIMESTAMP,MEASUREMENTS
1,0,[123,456,567.....]
1,100,[....]
1,350,[....]
2,0,[....]
2,200,[.....]
此外,测量数组在某些索引处包含 NaN。 最后,我有一些与每个 ID 相关联的标签,这是该 ID 的最后一个时间戳之前执行的测量结果。 我的目标是将这些数据拟合到 HMM 模型中,然后预测相同格式的测试数据集的标签。 如何将此模型拟合到 sklearn/hmmlearn 的 HMM 模型中? sklearns 文档不符合模型的要求,没有解释任何参数。
最佳答案
因为您的问题需要预测序列的标签。你应该使用 seqlearn这是一个序列分类工具。
此外,在 HMM 中拟合数据需要进行一些预处理,因为它接受数组列表。您可以按照相对于时间的升序连接时间戳和与每个 id 关联的三个测量值。这将为您提供每个 ID 的长度为 33 的序列。
如果您需要进一步的帮助,请告诉我。我最近在一个项目中使用了 HMMLearn。
关于python - 如何将数据拟合到隐马尔可夫模型 sklearn/hmmlearn,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33177022/