python - 机器学习精度显示 0

我在训练机器学习模型的准确性方面需要帮助。

我的训练输入是几个包含 500 个整数/数据的数组，我将其保存在名为“the_data”的数据集下的 hdf5 文件中。在这个例子中，我有 100 个数组。

[[1,2,3,...500],
 [501,502,...1000],
 [1001,...       ],
 ....
 ......          ]]

输出是我事先生成的随机数，并将其保存为“output.txt”。它有 100 个随机数。

194521, 307329, 182440, 180444, 275690,...,350879

下面是我根据http://machinelearningmastery.com/tutorial-first-neural-network-python-keras/修改的脚本

import h5py
from keras.models import Sequential
from keras.layers import Dense

seed = 7
np.random.seed(seed)

input_data = h5py.File('test.h5', 'r')
output_data = open("output.txt", "r")

X = input_data['the_data'][:]
Y = output_data.read().split(',')

model = Sequential()
model.add(Dense(500, input_dim=500, init='normal', activation='relu'))
model.add(Dense(100, init='normal', activation='relu'))
model.add(Dense(60, init='normal', activation='relu'))
model.add(Dense(1, init='normal', activation='sigmoid'))

model.compile(loss='binary_crossentropy', optimizer='adamax', metrics=['accuracy'])
model.fit(X, Y, nb_epoch=500, batch_size=10)
scores = model.evaluate(X, Y)

print("%s: %.2f%% , %s: %.2f%%" % (model.metrics_names[0], scores[0]*100, model.metrics_names[1], scores[1]*100))

我得到的结果是这样的

Epoch 500/500
100/100 [==============================] - 0s - loss: -4851446.0896 - acc: 0.0000e+00
100/100 [==============================] - 0s
loss: -485144614.93% , acc: 0.00%

有没有人想过为什么会这样？

感谢您的帮助。

最佳答案

你知道二元交叉熵是什么吗？

这是针对二进制(0 或 1)目标的损失函数。损失是 output 或 output - 1 的对数，具体取决于目标值。所以你不能在你的情况下应用它。

您想预测数值，因此您应该使用均方根误差之类的东西。

准确性也没有意义，因为您不是要预测一个类别，而是要预测一个实数值。它很少会准确地预测出好的结果。例如，精度与二元交叉熵一起使用，然后我们可以将 0.7 的输出分类为 1 类。或者 0.2 为 0 类。

还有一条评论:你为什么要预测随机值？它行不通……网络需要识别模式，而随机目标中没有模式。

希望对您有所帮助。

关于python - 机器学习精度显示 0，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42410242/

python - 机器学习精度显示 0

上一篇：python - 如何将字符串和列表的unicode组合到python列表

下一篇：python - 如何将数据框中一列的所有元素与另一个数据框中为该列指定的值相乘？