csv - 我的数据中用于训练股价预测器的目标是什么?

标签 csv machine-learning jupyter-notebook data-cleaning data-processing

我想为委内瑞拉的经济指标建立一个股票价格预测器,我已经清理和结构化了我想要使用的历史数据(过去 10 年),但我有疑问,因为这是我的第一个机器学习项目中,我的 CSV 数据包含 3000 多个条目,如下所示:

2553
11-28-2017;0.8823561
2554
11-29-2017;0.9679446
2555
11-30-2017;0.9719271
2556
12-1-2017;1.0302427

正如您所看到的,第 0 列有日期,第 1 列有该特定日期的价格,在这种情况下,训练数据 (X) 应该是价格,但是我想要使用的方法需要 X 和 Y (监督学习),因为这是我第一次获取自己的数据,我感觉有点失落,到目前为止我的代码是:https://github.com/marcelodiaz558/Venezuela-dollar-price-predictor/blob/development/model.ipynb我将来想用 LSTM 来训练我的模型,或者也许我会从一个简单的人工神经网络开始进行测试,当我解决对数据的疑问时,我不知道 Y 应该是谁。

最佳答案

Y/你的目标是你想要预测的。 X/您的训练数据是您先验知识的某种向量表示,可用于更好地预测未知量。在使用简单回归器的简单时间序列预测中,您的训练数据可以是过去 N 天的价格。

因此,使用您的示例数据,您希望能够根据过去两天的价格 (N=2) 预测 future 某一天的价格,您的 X Y 将是

X = [[0.8823561, 0.9679446], [0.9679446, 0.9719271]]
Y = [0.9719271, 1.0302427]

因此,要对数据进行机器学习,您需要根据您的需要对数据进行预处理。有些算法是专门为此任务设计的,因此不需要预处理,或者在实现中自动完成。

关于csv - 我的数据中用于训练股价预测器的目标是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59613964/

相关文章:

MySQL:动态导出带标题的 CSV 文件

python - 在 python 中将列标题添加到 csv

c++ - 如何将字符串写入 .csv 文件?

python - 如何使用 csv 将列表编写为单独的元素?

python - 使用粒子群优化进行适当的编码

machine-learning - 玩 Atari Breakout 时,简单策略梯度 (REINFORCE) 会过度拟合某个操作

python - 如何解决 Jupyter Notebook 中 No module named 'hmmlearn' 错误

latex - Jupyter笔记本:如何为LaTeX\usepackage {}

python - 箱线图:索引超出范围错误

apache-spark - 如何在 pyspark 中测试/训练按列值而不是按行分割