python - 表征股票市场神经网络的 Keras 损失和准确性

我最近尝试完成一个神经网络来预测股市个股价格的波动，利用 Keras 作为网络框架，并使用 Quandl 来检索历史调整后的股票价格；在运行该程序时，我主要使用了单个教程中显示的程序范例和信息，其链接如下所示:

https://www.youtube.com/watch?v=EYnC4ACIt2g&t=2079s

但是，本教程使用了“sklearn”线性回归模块；我修改了程序以使用 Keras，它具有更强的定制能力。程序如下所示:

import tensorflow as tf
import keras
import numpy as np
import quandl
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt

df = quandl.get("WIKI/FB")
df = df[['Adj. Close']]
forecast_out = 1
df['Prediction'] = df[['Adj. Close']].shift(-(forecast_out))

X = np.array(df.drop(['Prediction'], 1))
X = X[:-forecast_out]

y = np.array(df['Prediction'])
y = y[:-forecast_out]
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size = 0.2) 

model = keras.models.Sequential()
model.add(keras.layers.Dense(units = 64, activation = 'relu'))
model.add(keras.layers.Dense(units = 1, activation = 'linear'))

model.compile(loss='mean_absolute_error',
              optimizer='adam',
              metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5, batch_size=32, validation_split = 0.2)

x_forecast = np.array(df.drop(['Prediction'], 1))[-forecast_out:]
print(x_forecast)

prediction = model.predict(x_train)

但是，在通过 model.fit() 命令使用提供的测试信息运行模型时，我收到了每个时期的损失和准确性的显示:

Train on 940 samples, validate on 236 samples
Epoch 1/5
940/940 [==============================] - 1s 831us/step - loss: 85.4464 - acc: 0.0000e+00 - val_loss: 76.7483 - val_acc: 0.0000e+00
Epoch 2/5
940/940 [==============================] - 0s 51us/step - loss: 65.6871 - acc: 0.0000e+00 - val_loss: 55.4325 - val_acc: 0.0000e+00
Epoch 3/5
940/940 [==============================] - 0s 52us/step - loss: 43.3484 - acc: 0.0000e+00 - val_loss: 30.5538 - val_acc: 0.0000e+00
Epoch 4/5
940/940 [==============================] - 0s 47us/step - loss: 16.5076 - acc: 0.0011 - val_loss: 1.3096 - val_acc: 0.0042
Epoch 5/5
940/940 [==============================] - 0s 47us/step - loss: 2.0529 - acc: 0.0043 - val_loss: 1.1567 - val_acc: 0.0000e+00
<keras.callbacks.History at 0x7ff1dfa19470>

鉴于我在测试此类范例方面的经验相对较少，我更想知道这种准确性是否令人满意；损失和准确率参数是否表明模型运行完美？它们之间有什么区别以及如何阅读它们？最后，Keras 如何描述它们？该模块的文档似乎没有提供足够的信息；然而，这可能是我对它们的检查造成的。感谢您的帮助。

最佳答案

您可能会在 CrossValidated 上获得有关神经网络/ML 的更好答案，但我可以尝试在这里帮助你。

一般来说，判断神经网络是否“正常”运行是非常非常困难的 - 因此根据我的经验，机器学习开发是一个非常迭代的过程，通过有根据的统计/数学猜测来进行试验和错误。

让我们首先对指标进行高级概述:

损失 = 模型的预测与您的数据“偏离”多远。

准确度 = 您的模型“正确”的预测百分比；即，如果您的模型是一个函数，则特定数据点的 model(x) = y。

令人满意的“准确性”是主观的，并且很大程度上取决于应用程序/模型/您的数据。但是，由于您正在尝试预测股票价格；即连续变量，你正在做回归，使用像准确性这样的指标对我来说没有多大意义。我可以告诉你，通过你的问题表述，你正在做回归——线性激活也是一个强烈的暗示。

要明白为什么准确性没有意义，如果我根据某些因素预测房价，我可能并不关心我有多少预测完全正确，而是更关心我的预测总体上有多接近。如果我的回归模型每房价折扣 1 美元，我的准确度仍然为 0，但我仍然有可能拥有一个好的模型。

相反，最小化损失函数可能是更好的思考方式。这样想:总的来说，您希望拟合输入变量的某些函数，使其“接近”真实输出。对于 linear regression ，损失函数是LMS(最小均方)，本质上是残差的平均平方距离。这里使用平均绝对误差，它只是差值的平均绝对值。两种损失函数都有优点和缺点，我鼓励您在您的应用程序中研究这一点。

错误减少的事实是好的:这意味着您的模型近似的函数越来越接近训练数据(残差正在减少)。您的验证损失也不大于训练数据，这表明您也没有过度拟合数据。我鼓励您继续尝试。

关于python - 表征股票市场神经网络的 Keras 损失和准确性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59594496/

python - 表征股票市场神经网络的 Keras 损失和准确性

上一篇：python - Keras Conv2D 解码器

下一篇：python - IndexError : Dimension out of range (expected to be in range of [-1, 0]，但得到 1)