python - 如何将数据拟合到隐马尔可夫模型 sklearn/hmmlearn

标签 python scikit-learn hidden-markov-models hmmlearn

我有一个时间序列数据集作为一个包含以下列的 csv 文件-

ID,TIMESTAMP,MEASUREMENTS[10]

对于一个 ID,有多个测量值以及进行这些测量值时的相关时间戳。列测量值包含 10 个测量值的列表。一条记录(与特定时间戳相关联)中的测量在某种程度上取决于前一条记录。

例如。数据集:

ID,TIMESTAMP,MEASUREMENTS
1,0,[123,456,567.....]
1,100,[....]
1,350,[....]
2,0,[....]
2,200,[.....]

此外,测量数组在某些索引处包含 NaN。 最后,我有一些与每个 ID 相关联的标签,这是该 ID 的最后一个时间戳之前执行的测量结果。 我的目标是将这些数据拟合到 HMM 模型中,然后预测相同格式的测试数据集的标签。 如何将此模型拟合到 sklearn/hmmlearn 的 HMM 模型中? sklearns 文档不符合模型的要求,没有解释任何参数。

最佳答案

因为您的问题需要预测序列的标签。你应该使用 seqlearn这是一个序列分类工具。

此外,在 HMM 中拟合数据需要进行一些预处理,因为它接受数组列表。您可以按照相对于时间的升序连接时间戳和与每个 id 关联的三个测量值。这将为您提供每个 ID 的长度为 33 的序列。

如果您需要进一步的帮助,请告诉我。我最近在一个项目中使用了 HMMLearn。

关于python - 如何将数据拟合到隐马尔可夫模型 sklearn/hmmlearn,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33177022/

相关文章:

python - 无法理解GaussianHMM()中这些参数之间的区别

python - 具有复合键的 Flask-SQLAlchemy 多对多

c++ - 调用外部 C++ 函数和内存泄漏 : is all allocated memory cleaned up after finishing Python script?

python - 如何在 Python 回归模型中合并和预测滞后时间序列变量

python - split() 缺少 1 个必需的位置参数 : 'y'

machine-learning - Word2Vec 和 Glove 向量适合实体识别吗?

python - pi 到 arduino 串行通信上的名称错误

python - 为什么我的异常消息不会随着我的 if 语句而改变

python-3.x - 为什么使用 sklearn 库随机生成的数据精度较低

python - GHMM - 尝试对 NULL 指针进行 m_free