tensorflow - 为什么将reduce_mean应用于sparse_softmax_cross_entropy_with_logits的输出？

有几个教程将 reduce_mean 应用于 sparse_softmax_cross_entropy_with_logits 的输出。例如

cross_entropy = -tf.reduce_sum(y_ * tf.log(y_conv))

或

cross_entropy = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(
                               labels=tf.cast(y_, dtype=tf.int32), logits=y_conv))

为什么将reduce_mean应用于sparse_softmax_cross_entropy_with_logits的输出？是否因为我们使用的是小批量，所以我们想要计算(使用 reduce_mean)小批量所有样本的平均损失？

最佳答案

原因是为了获得批处理的平均损失。

通常，您将训练一个输入批处理大小 > 1 的神经网络，批处理中的每个元素都会产生一个损失值，因此将这些元素合并为一个值的最简单方法是求平均值。

关于tensorflow - 为什么将reduce_mean应用于sparse_softmax_cross_entropy_with_logits的输出？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50604095/

上一篇：wordpress - 在 WooCommerce 中隐藏运输和付款方式

下一篇：python - 如何在 HDP 中的 zeppelin-spark2 中将库安装到 python

相关文章：

tensorflow - 批量标准化破坏了验证性能

python - Tensorflow:如何创建 Pascal VOC 风格的图像

python - 应用 PyTorch CrossEntropy 方法进行多类分割

python - 如何使用torch.nn.CrossEntropyLoss作为自动编码器的重建损失？

python - 使用 tf.data 和 mode.fit 时 1DConv 输入的维度出错

machine-learning - TensorFlow - 如何使用 Plain TensorFlow 训练 ANN

keras - Matterport Mask-R-CNN 的损失究竟是什么？

pytorch - 当批量大小不是 train_size 的一个因素时，将 loss().item 乘以 batch_size 以获得批量损失是否是个好主意？

keras - 最小化和最大化损失

tensorflow - TensorFlow SparseCategoricalCrossentropy 如何工作？