machine-learning - 谷歌云作业提交培训陷入困境

标签 machine-learning neural-network google-cloud-platform google-cloud-ml

您好,当我设置谷歌云机器学习来训练神经网络时,突然我无法向谷歌云提交作业。

没有错误,但命令卡在那里,没有执行任何操作,而且我的实例正在运行。这是命令:

gcloud ml-engine jobs submit training job9123 --runtime-version 1.0 --job-dir gs://dataset1_giorgaros2 --package-path trainmodule  --module-name trainmodule.nncloud --region europe-west1 --config cloudml-gpu.yaml -- --train-file gs://dataset1_giorgaros2/nnn.p

谢谢!

最佳答案

机器学习引擎作业日志可以帮助获取有关失败作业执行的更多详细信息,在大多数情况下,日志文件包含失败的原因。

Finding the job logs on ML engine

如果您每次在训练作业执行中尝试相同的命令,您可能会收到有关作业名称的错误,这是因为 ML 引擎上的每个作业的名称必须是唯一的,正如在ML 引擎作业的命名约定规则。

ML Engine name convention

关于machine-learning - 谷歌云作业提交培训陷入困境,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50795413/

相关文章:

python - 图像分类器训练期间准确率接近 100%,但测试/验证期间准确率 <50%

python - 优达学城 : Assignment 3: ValueError: bad input shape (1000, 10)

python - 如何在 Google Cloud Shell 上安装库 python-docx/docx?

python - 确定为什么特征在决策树模型中很重要

python - 如何减少VGG16中间层瓶颈特征的大小?

neural-network - 在 Caffe 框架中修改 ReLU 中的阈值

tensorflow - 如何获得可重现的结果(Keras、Tensorflow):

python - 复制特定层的权重 - keras

google-cloud-platform - GCP - GPU 暂存时间减少

javascript - 谷歌操作(ActionsSdkApp)意图不响应我的意图