python - 通过时间序列实现在线学习

标签 python r machine-learning scikit-learn

我遇到时间序列数据的分类问题。

每个示例都有 10 个变量，这些变量以不规则的间隔进行测量，最终对象被分类为 2 个可能类别中的 1 个类别(二元分类)。

在训练期间我只有示例的最后一课可以学习。但是当给出一个新的例子时，我想在每个时间戳进行预测(以在线方式)。因此，如果新示例有 25 个测量值，我想对其类别进行 25 个预测；每个时间戳一个。

我目前实现这一点的方法是使用 10 个变量的测量值的最小值、平均值和最大值作为分类特征。这是最优的吗？有什么更好的方法。

最佳答案

如果您必须在每个时间戳进行预测，那么这不会成为时间序列问题(除非您计划使用先前观察的序列来进行下一个预测，在这种情况下您将需要训练一个基于序列的模型)。假设您只能根据您观察到的最终数据来训练模型，可以有很多方法，但我建议您使用具有大量树并且每棵树中有 3 或 4 个变量的随机森林。这样，即使某些变量没有为您提供所需的输入，其他树仍然可以做出相当准确的预测。除此之外，还可以有许多集成方法。

您当前所做的方式可能是非常宽松的近似且实用，但没有太大的统计意义。

关于python - 通过时间序列实现在线学习，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33168836/

上一篇：matlab - K折交叉验证

下一篇：machine-learning - 支持向量机理解

相关文章：

python - 在名称约定更改的循环中生成变量名称

python - 狮身人面像/rST : using configuration values in include statements?

r - 如何生成矩阵 A) 每一行只有一个值 1； B)行总和为一

r - 查找先前出现的值并在相对列中获取值

apache-spark - 来自 RDD 的 PySpark LDA 模型密集向量

python - tensorflow 中几个梯度的计算

python - 如何获取一个列表并以随机顺序打印所有内容，并在 python 中打印每个内容一次？

Python 2.7 - 最小内置函数未按预期工作

python - 在 python pandas 数据框中将十六进制转换为十进制

python - Q-Learning Table收敛到-inf