python - Tensorflow 返回相同的预测

标签 python tensorflow neural-network deep-learning

我正在尝试制作我的第一个 tensorflow 模型,但是我遇到了一些问题。看起来它使火车正确,但当它进行预测时,它只是返回(几乎)总是相同的值。这是代码:

n_classes = 2

tf.reset_default_graph()

x = tf.placeholder('float')
y = tf.placeholder('float')
keep_rate = tf.placeholder(tf.float32)

weights = {'W_conv1':tf.Variable(tf.random_normal([3,3,3,1,32]),
           'W_conv2':tf.Variable(tf.random_normal([3,3,3,32,64])),
           'W_fc':tf.Variable(tf.random_normal([54080,1024])),
           'out':tf.Variable(tf.random_normal([1024, n_classes]))}

biases = {'b_conv1':tf.Variable(tf.random_normal([32])),
           'b_conv2':tf.Variable(tf.random_normal([64])),
           'b_fc':tf.Variable(tf.random_normal([1024])),
           'out':tf.Variable(tf.random_normal([n_classes]))}


def conv3d(x, W):
    return tf.nn.conv3d(x, W, strides=[1,1,1,1,1], padding='SAME')

def maxpool3d(x):
    return tf.nn.max_pool3d(x, ksize=[1,2,2,2,1], strides=[1,2,2,2,1], padding='SAME')

def convolutional_neural_network(x, keep_rate):
    x = tf.reshape(x, shape=[-1, IMG_SIZE_PX, IMG_SIZE_PX, SLICE_COUNT, 1])

    conv1 = tf.nn.relu(conv3d(x, weights['W_conv1']) + biases['b_conv1'])
    conv1 = maxpool3d(conv1)


    conv2 = tf.nn.relu(conv3d(conv1, weights['W_conv2']) + biases['b_conv2'])
    conv2 = maxpool3d(conv2)

    fc = tf.reshape(conv2,[-1, 54080])
    fc = tf.nn.relu(tf.matmul(fc, weights['W_fc'])+biases['b_fc'])
    fc = tf.nn.dropout(fc, keep_rate)

    output = tf.matmul(fc, weights['out'])+biases['out']

    return output

much_data = np.load('F:/Kaggle/Data Science Bowl 2017/Script/muchdata-50-50-20.npy')

train_data = much_data[:-100]
validation_data = much_data[-100:]


def train_neural_network(x):
    prediction = convolutional_neural_network(x, keep_rate)
    cost = tf.reduce_mean( tf.nn.softmax_cross_entropy_with_logits(logits=prediction, labels=y) )
    optimizer = tf.train.AdamOptimizer(learning_rate=1e-3).minimize(cost)

    hm_epochs = 10
    with tf.Session() as sess:
        sess.run(tf.global_variables_initializer())

        for epoch in range(hm_epochs):
            epoch_loss = 0
            for data in train_data:
                X = data[0]
                Y = data[1]
                _, c = sess.run([optimizer, cost], feed_dict={x: X, y: Y, keep_rate: 0.75})
                epoch_loss += c

            print('Epoch', epoch+1, 'completed out of',hm_epochs,'loss:',epoch_loss)

            correct = tf.equal(tf.argmax(prediction, 1), tf.argmax(y, 1))
            accuracy = tf.reduce_mean(tf.cast(correct, 'float'))

            print('Accuracy:',accuracy.eval({x:[i[0] for i in validation_data], y:[i[1] for i in validation_data], keep_rate: 1.}))

        print('Done. Finishing accuracy:')
        print('Accuracy:',accuracy.eval({x:[i[0] for i in validation_data], y:[i[1] for i in validation_data], keep_rate: 1.}))

        eval_data = np.load('F:/Kaggle/Data Science Bowl 2017/Script/eval_data-50-50-20.npy')

        probabilities = tf.nn.softmax(prediction)
        sol = []
        for data in eval_data:
            X = data[0]
            id = data[1]
            probs = probabilities.eval(feed_dict={x: X, keep_rate: 1.})
            pred = prediction.eval(feed_dict={x: X, keep_rate: 1.})
            print('Outputs: ',pred)
            print('Probs: ',probs)
            sol.append([id, probs[0,1]])
        print(sol)

我还在模型训练期间检查了预测,如果我将 keep_rate 设置为 1,我也会在最后得到几乎总是不变的预测。在第一个时期有很多变化,但在最后一个时期,神经网络似乎总是对每张图像进行相同的预测。它似乎收敛到一个唯一的预测值,而没有考虑我传递给神经网络的图像。我检查了一百次,但看不出错误在哪里。

这是我在 eval_data 中得到的一些图像的示例(当我打印 train_data 时同样的行为):

Probs:  [[ 0.76099759  0.23900245]]
Outputs:  [[-0.017277  -1.1754334]]
Probs:  [[ 0.76099759  0.23900245]]
Outputs:  [[-0.017277  -1.1754334]]
Probs:  [[ 0.76099759  0.23900245]]
Outputs:  [[ 117714.1953125   -47536.32421875]]
Probs:  [[ 1.  0.]]
Outputs:  [[-0.017277  -1.1754334]]
Probs:  [[ 0.76099759  0.23900245]]
Outputs:  [[-0.017277  -1.1754334]]
Probs:  [[ 0.76099759  0.23900245]]
Outputs:  [[-0.017277  -1.1754334]]
Probs:  [[ 0.76099759  0.23900245]]

注意它们几乎总是相同的,但有时我会看到一些奇怪的值,比如

Outputs:  [[ 117714.1953125   -47536.32421875]]
Probs:  [[ 1.  0.]]

希望有人能给出答案,这让我很头疼。

非常感谢您的耐心等待!我还是 Tensorflow 的新手 :D

最佳答案

我也遇到了同样的问题,我花了两周时间才找到原因。它可能对你有帮助。我的问题是由于嘈杂的数据集和高学习率。由于 ReLU 激活会杀死神经元,当数据集嘈杂时,大部分 ReLU 将死亡(不会对任何输入激活,因为它认为其输入无用),那么网络可能只会学习一些固定分布的最终标签。因此结果固定为任何输入。

我的解决方案是使用 tf.nn.leaky_relu(),因为它不会杀死负输入。

关于python - Tensorflow 返回相同的预测,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43329935/

相关文章:

python - 如何修改全局变量?

捕获 2 个字符 ('=' 和 'I' 之间信息的 Python 正则表达式代码

Python 将文本分配给新变量

java - ND4J在GPU上运行缓慢,但在CPU上运行速度很快

machine-learning - 神经网络发散而不是收敛

python - 神经网络损失函数和权重矩阵不匹配

python - 如何在 snakemake 输出中执行简单的字符串操作

python - 如何防止keras重命名图层

tensorflow - super (类型,对象): obj must be an instance or subtype of type in Keras

python - 从 pypi 安装我的新包时只找到旧的 tensorflow 版本