根据第 1 周和第 2 周的数据,我正在尝试训练一个模型来预测第 3 周的数据。
目标标签称为目标。
鉴于此问题查看用户历史操作来预测他们的 future 操作,我对应该使用哪些正确特征来训练模型感到困惑
训练数据
id,date,week_day,target
1,2019-01-01,1,10
1,2019-01-02,2,6
1,2019-01-03,3,7
2,2019-01-01,1,8
2,2019-01-02,1,5
2,2019-01-03,1,4
测试数据(查看 future 日期)
id,date,week_day,target
1,2019-01-10,1,15
1,2019-01-11,2,13
1,2019-01-12,3,8
2,2019-01-10,1,7
2,2019-01-11,1,7
2,2019-01-12,1,4
1)我想知道将 id 作为训练数据中的特征是否正确?我知道大多数机器学习问题不会保留 id 字段,但这个问题与测试数据集中使用相同 id 字段略有不同。
2)我计划删除日期字段
最佳答案
看来你的问题可以看作是时间序列预测。您的数据具有季节性。您可以尝试诸如sarima 之类的算法,而不是执行回归。
关于machine-learning - 给定时间序列数据训练回归模型的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54377791/