python - 表征股票市场神经网络的 Keras 损失和准确性

标签 python machine-learning keras neural-network quandl

我最近尝试完成一个神经网络来预测股市个股价格的波动,利用 Keras 作为网络框架,并使用 Quandl 来检索历史调整后的股票价格;在运行该程序时,我主要使用了单个教程中显示的程序范例和信息,其链接如下所示:

https://www.youtube.com/watch?v=EYnC4ACIt2g&t=2079s

但是,本教程使用了“sklearn”线性回归模块;我修改了程序以使用 Keras,它具有更强的定制能力。程序如下所示:

import tensorflow as tf
import keras
import numpy as np
import quandl
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

df = quandl.get("WIKI/FB")
df = df[['Adj. Close']]
forecast_out = 1
df['Prediction'] = df[['Adj. Close']].shift(-(forecast_out))

X = np.array(df.drop(['Prediction'], 1))
X = X[:-forecast_out]

y = np.array(df['Prediction'])
y = y[:-forecast_out]
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size = 0.2) 

model = keras.models.Sequential()
model.add(keras.layers.Dense(units = 64, activation = 'relu'))
model.add(keras.layers.Dense(units = 1, activation = 'linear'))

model.compile(loss='mean_absolute_error',
              optimizer='adam',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split = 0.2)

x_forecast = np.array(df.drop(['Prediction'], 1))[-forecast_out:]
print(x_forecast)

prediction = model.predict(x_train)

但是,在通过 model.fit() 命令使用提供的测试信息运行模型时,我收到了每个时期的损失和准确性的显示:

Train on 940 samples, validate on 236 samples
Epoch 1/5
940/940 [==============================] - 1s 831us/step - loss: 85.4464 - acc: 0.0000e+00 - val_loss: 76.7483 - val_acc: 0.0000e+00
Epoch 2/5
940/940 [==============================] - 0s 51us/step - loss: 65.6871 - acc: 0.0000e+00 - val_loss: 55.4325 - val_acc: 0.0000e+00
Epoch 3/5
940/940 [==============================] - 0s 52us/step - loss: 43.3484 - acc: 0.0000e+00 - val_loss: 30.5538 - val_acc: 0.0000e+00
Epoch 4/5
940/940 [==============================] - 0s 47us/step - loss: 16.5076 - acc: 0.0011 - val_loss: 1.3096 - val_acc: 0.0042
Epoch 5/5
940/940 [==============================] - 0s 47us/step - loss: 2.0529 - acc: 0.0043 - val_loss: 1.1567 - val_acc: 0.0000e+00
<keras.callbacks.History at 0x7ff1dfa19470>

鉴于我在测试此类范例方面的经验相对较少,我更想知道这种准确性是否令人满意;损失和准确率参数是否表明模型运行完美?它们之间有什么区别以及如何阅读它们?最后,Keras 如何描述它们?该模块的文档似乎没有提供足够的信息;然而,这可能是我对它们的检查造成的。感谢您的帮助。

最佳答案

您可能会在 CrossValidated 上获得有关神经网络/ML 的更好答案,但我可以尝试在这里帮助你。

一般来说,判断神经网络是否“正常”运行是非常非常困难的 - 因此根据我的经验,机器学习开发是一个非常迭代的过程,通过有根据的统计/数学猜测来进行试验和错误。

让我们首先对指标进行高级概述:

损失 = 模型的预测与您的数据“偏离”多远。

准确度 = 您的模型“正确”的预测百分比;即,如果您的模型是一个函数,则特定数据点的 model(x) = y。

令人满意的“准确性”是主观的,并且很大程度上取决于应用程序/模型/您的数据。但是,由于您正在尝试预测股票价格;即连续变量,你正在做回归,使用像准确性这样的指标对我来说没有多大意义。我可以告诉你,通过你的问题表述,你正在做回归——线性激活也是一个强烈的暗示。

要明白为什么准确性没有意义,如果我根据某些因素预测房价,我可能并不关心我有多少预测完全正确,而是更关心我的预测总体上有多接近。如果我的回归模型每房价折扣 1 美元,我的准确度仍然为 0,但我仍然有可能拥有一个好的模型。

相反,最小化损失函数可能是更好的思考方式。这样想:总的来说,您希望拟合输入变量的某些函数,使其“接近”真实输出。对于 linear regression ,损失函数是LMS(最小均方),本质上是残差的平均平方距离。这里使用平均绝对误差,它只是差值的平均绝对值。两种损失函数都有优点和缺点,我鼓励您在您的应用程序中研究这一点。

错误减少的事实是好的:这意味着您的模型近似的函数越来越接近训练数据(残差正在减少)。您的验证损失也不大于训练数据,这表明您也没有过度拟合数据。我鼓励您继续尝试。

关于python - 表征股票市场神经网络的 Keras 损失和准确性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59594496/

相关文章:

python - paho MQTT on_message 返回一条有趣的消息 - python

python - VIM:预览高度

machine-learning - 使用有偏差的数据集训练决策树

machine-learning - GridSearchCV + StratifiedKfold(如果是 TFIDF)

python - Pygame:按住键时玩家不会移动

python - 生成器表达式组合行理解执行步骤

python - 使用 python 和 numpy 进行梯度下降

python - 用于时间序列预测的最佳激活函数是什么

python-3.x - keras连接多个层导致AttributeError : 'NoneType' object has no attribute '_inbound_nodes'

tensorflow - 使用 Keras Tuner 进行时间序列分割