python - Cuda 错误消息 : F ./tensorflow/core/util/cuda_launch_config.h :127] Check failed: work_element_count > 0 (0 vs. 0)

标签 python tensorflow

我正在尝试训练 mask rcnn model在 p2.xlarge EC2 aws 实例上对我自己的数据集使用 Keras。

当我启动培训时,经过几个步骤的培训:

Epoch 1/1    2/1000 [..............................] - ETA: 4:27:49 - loss: 5.1578 - rpn_class_loss: 0.0937 - rpn_bbox_loss: 0.6471 - mrcnn_class_loss: 2.6594 - mrcnn_bbox_loss: 1.1266 - mrcnn_mask_loss:
0.6311

我收到此错误消息:

2018-05-02 13:44:56.193439: F ./tensorflow/core/util/cuda_launch_config.h:127] Check failed: work_element_count > 0 (0 vs. 0)

我的图像相对较小 (~100Kb),数据集中的图像很少 (~150)。

我使用的配置如下:

class CustomConfig(Config):
    """Configuration for training on the custom dataset.
    Derives from the base Config class
    """
    # Give the configuration a recognizable name
    NAME = "blabla"

    # We use a GPU with 12GB memory, which can fit two images.
    # Adjust down if you use a smaller GPU.
    IMAGES_PER_GPU = 2

    # Number of classes (including background)
    NUM_CLASSES = 11

有什么建议吗?谢谢!

最佳答案

我将我的 tensorflow-gpu 包降级到 1.7.0 并且它有效

关于python - Cuda 错误消息 : F ./tensorflow/core/util/cuda_launch_config.h :127] Check failed: work_element_count > 0 (0 vs. 0),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50136482/

相关文章:

python - 如何使用 pip 升级所有 Python 包?

python-3.x - 为什么我的损失函数返回负值?

android - 如何修复此模块 'tensorflow' 没有属性 'lite'?

python - 从多个文件构造数据框,其中每个文件包含列数据

Python 日志记录 : change log message level

python - 在 Python 中使用 igraph 进行社区检测

python - 我建立了一个 CNN 来检测人脸。从第一个纪元开始,我就获得了更高的准确性。可能是什么原因?

python - Tensorflow 数据集 API - 将窗口应用于多个序列

tensorflow - 如何停止 tensorflow 中张量某些条目的梯度

Python Pandas Dataframe 将 NaN 替换为列表中的值