machine-learning - 给定时间序列数据训练回归模型的最佳方法

标签 machine-learning regression data-science feature-selection

根据第 1 周和第 2 周的数据,我正在尝试训练一个模型来预测第 3 周的数据。

目标标签称为目标

鉴于此问题查看用户历史操作来预测他们的 future 操作,我对应该使用哪些正确特征来训练模型感到困惑

训练数据

id,date,week_day,target
1,2019-01-01,1,10
1,2019-01-02,2,6
1,2019-01-03,3,7
2,2019-01-01,1,8
2,2019-01-02,1,5
2,2019-01-03,1,4

测试数据(查看 future 日期)

id,date,week_day,target
1,2019-01-10,1,15
1,2019-01-11,2,13
1,2019-01-12,3,8
2,2019-01-10,1,7
2,2019-01-11,1,7
2,2019-01-12,1,4

1)我想知道将 id 作为训练数据中的特征是否正确?我知道大多数机器学习问题不会保留 id 字段,但这个问题与测试数据集中使用相同 id 字段略有不同。

2)我计划删除日期字段

最佳答案

看来你的问题可以看作是时间序列预测。您的数据具有季节性。您可以尝试诸如sarima 之类的算法,而不是执行回归。

关于machine-learning - 给定时间序列数据训练回归模型的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54377791/

相关文章:

apache-spark - 如何在 pyspark 中测试/训练按列值而不是按行分割

matlab - 多类支持向量机。二元决策树。 LIBSVM 的问题

python - 如何计算对象关键点相似度

python - 减少校准中的测量次数

r - 用 R 和 dplyr 显示拟合值

python - 在 python 中使用 sklearn 进行连续数据的逻辑回归

python - 对 pandas 数据帧重新采样并插入时间序列数据的缺失值

machine-learning - NLP 和 ML 文本提取

pandas - 为什么当值不同时相关性是1?

python - 在生产中训练机器学习