python - 机器学习精度显示 0

标签 python machine-learning

我在训练机器学习模型的准确性方面需要帮助。

我的训练输入是几个包含 500 个整数/数据的数组,我将其保存在名为“the_data”的数据集下的 hdf5 文件中。在这个例子中,我有 100 个数组。

[[1,2,3,...500],
 [501,502,...1000],
 [1001,...       ],
 ....
 ......          ]]

输出是我事先生成的随机数,并将其保存为“output.txt”。它有 100 个随机数。

194521, 307329, 182440, 180444, 275690,...,350879

下面是我根据http://machinelearningmastery.com/tutorial-first-neural-network-python-keras/修改的脚本

import h5py
from keras.models import Sequential
from keras.layers import Dense

seed = 7
np.random.seed(seed)

input_data = h5py.File('test.h5', 'r')
output_data = open("output.txt", "r")

X = input_data['the_data'][:]
Y = output_data.read().split(',')

model = Sequential()
model.add(Dense(500, input_dim=500, init='normal', activation='relu'))
model.add(Dense(100, init='normal', activation='relu'))
model.add(Dense(60, init='normal', activation='relu'))
model.add(Dense(1, init='normal', activation='sigmoid'))

model.compile(loss='binary_crossentropy', optimizer='adamax', metrics=['accuracy'])
model.fit(X, Y, nb_epoch=500, batch_size=10)
scores = model.evaluate(X, Y)

print("%s: %.2f%% , %s: %.2f%%" % (model.metrics_names[0], scores[0]*100, model.metrics_names[1], scores[1]*100))

我得到的结果是这样的

Epoch 500/500
100/100 [==============================] - 0s - loss: -4851446.0896 - acc: 0.0000e+00
100/100 [==============================] - 0s
loss: -485144614.93% , acc: 0.00%

有没有人想过为什么会这样?

感谢您的帮助。

最佳答案

你知道二元交叉熵是什么吗?

这是针对二进制(0 或 1)目标的损失函数。损失是 outputoutput - 1 的对数,具体取决于目标值。 所以你不能在你的情况下应用它。

您想预测数值,因此您应该使用均方根误差之类的东西。

准确性也没有意义,因为您不是要预测一个类别,而是要预测一个实数值。它很少会准确地预测出好的结果。例如,精度与二元交叉熵一起使用,然后我们可以将 0.7 的输出分类为 1 类。或者 0.2 为 0 类。

还有一条评论:你为什么要预测随机值?它行不通……网络需要识别模式,而随机目标中没有模式。

希望对您有所帮助。

关于python - 机器学习精度显示 0,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42410242/

相关文章:

python - Pandas df.iterrows() 并行化

python - 在 Numpy 中乘积 block 矩阵

python - pytorch Faster-RCNN 的验证损失

python - 2016 年 Django 服务器发送的事件

python - 创建一个持续到浏览器关闭的 cookie(Session Cookie?)

python - 是否可以在 keras LSTM 的标签集中屏蔽 NaN 值?

python - Tensorflow:Cifar-10 模型中的输出节点名称是什么?

machine-learning - PySpark ML : Get KMeans cluster statistics

python - 如何将一个类的功能分离到多个文件中?

python - 如何在 Python 中使用 cd 终端命令