machine-learning - LSTM 和标签

让我们从“我知道机器学习无法比猴子更好地预测股市”开始。但我只想完成它。

我的问题是一个理论问题。假设我有日期、开盘价、最高价、最低价、收盘价作为列。所以我想我有 4 个特征:开盘价、最高价、最低价、收盘价。

“my_close”将成为我的标签(答案)，我将使用当前行 7 天后的“close”。基本上，我将“close”列向上移动 7 行，并使其成为一个名为“my_close”的新列。

LSTM 作用于序列。所以说我设定的顺序是20天。因此我的形状将是(1000天的数据，20天的序列，3个特征)。

困扰我的问题是这 20 天或这 20 行数据是否应该具有完全相同的标签？或者他们可以有单独的标签吗？或者我误解了整个理论？

谢谢大家。

最佳答案

就您而言，您希望使用前 7 天的股票值(value)来预测当天的股票价格。在输入模型之前，构建输入和输出的方式需要进行一些修改。

您在理解时间步长(在您的序列中)时犯了错误。通俗地说，时间步长(序列)是我们在预测输出时考虑的输入总数。在您的例子中，它将是 7(不是 20)，因为我们将使用前 7 天的数据来预测当天的输出。

您的输入应该是前 7 天的信息

[F11,F12,F13],[F21,F22,F23],........,[F71,F72,F73]

Fij 其中，F 代表特征，i 代表时间步长，j 代表特征编号。

输出为第8天的股价。在这里，您的模型将分析前 7 天的输入并预测输出。因此，要回答您的问题，您将拥有一个用于前 7 天输入的通用标签。

我强烈建议您多学习一些 LSTM。

关于machine-learning - LSTM 和标签，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51337404/