让我们从“我知道机器学习无法比猴子更好地预测股市”开始。 但我只想完成它。
我的问题是一个理论问题。 假设我有日期、开盘价、最高价、最低价、收盘价作为列。所以我想我有 4 个特征:开盘价、最高价、最低价、收盘价。
“my_close”将成为我的标签(答案),我将使用当前行 7 天后的“close”。基本上,我将“close”列向上移动 7 行,并使其成为一个名为“my_close”的新列。
LSTM 作用于序列。所以说我设定的顺序是20天。 因此我的形状将是(1000天的数据,20天的序列,3个特征)。
困扰我的问题是这 20 天或这 20 行数据是否应该具有完全相同的标签?或者他们可以有单独的标签吗? 或者我误解了整个理论?
谢谢大家。
最佳答案
就您而言,您希望使用前 7 天的股票值(value)来预测当天的股票价格。在输入模型之前,构建输入和输出的方式需要进行一些修改。
您在理解时间步长(在您的序列中)时犯了错误。 通俗地说,时间步长(序列)是我们在预测输出时考虑的输入总数。在您的例子中,它将是 7(不是 20),因为我们将使用前 7 天的数据来预测当天的输出。
您的输入应该是前 7 天的信息
[F11,F12,F13],[F21,F22,F23],........,[F71,F72,F73]
Fij 其中,F 代表特征,i 代表时间步长,j 代表特征编号。
输出为第8天的股价。 在这里,您的模型将分析前 7 天的输入并预测输出。 因此,要回答您的问题,您将拥有一个用于前 7 天输入的通用标签。
我强烈建议您多学习一些 LSTM。
关于machine-learning - LSTM 和标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51337404/