tensorflow - 分布式 Tensorflow : check failed: size>=0

标签 tensorflow tensorflow-gpu

我正在使用 keras 2.0.6。 tensorflow 的版本是 1.3.0。

我的代码可以使用 theano 后端运行,但使用 tensorflow 后端失败:

F tensorflow/core/framework/tensor_shape.cc:241] 检查失败:大小 >= 0 (-14428307456 vs. 0)

我想知道是否有人能想到可能导致这种情况的任何可能原因。

谢谢!

- - 更新 - - -

我使用 tensorflow 在我的 PC 上测试了完全相同的代码。它运行完美。

但是,当我在 super 计算机上运行它时,它会抛出此错误。

虽然这个错误看起来像溢出,但它不可能不是在我的 PC 上溢出,而是在 super 计算机上溢出。

我怀疑它来自用于分布式计算的 tensorflow 上的错误。

最佳答案

它出现了同样的错误,但在我缩小批量大小之后它运行正常。

我认为原因是它的 GPU 内存不足。

关于tensorflow - 分布式 Tensorflow : check failed: size>=0,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45423134/

相关文章:

tensorflow-gpu - 在 Tensorflow 对象检测 API 中定义 GPU 选项

tensorflow - 如何在具有数据并行性的多个 GPU 上运行 Tensorflow Estimator

tensorflow - 如何从 PredictResponse 对象中检索 float_val?

tensorflow - 是否可以在一个 GPU 上同时训练 pytorch 和 tensorflow 模型?

tensorflow - Tesla V100 上的 TF1.4 未启用混合精度

python - 从 C++ 运行 python 脚本时内存泄漏

适用于 Windows 的 Tensorflow C 库 "available"?

tensorflow - 如何使用 Keras API 在 Tensorflow 2.0 中的多个 GPU 上加载模型后继续训练?

tensorflow - 如何知道已保存模型中的输出和输入张量名称

python - 如何在 Keras 中创建依赖于纪元数的损失函数参数?