google-cloud-ml - 没有名为 trainer 的模块

标签 google-cloud-ml

我有一个非常简单的训练器,它遵循示例目录结构:

/dist
  __init__.py
  setup.py
  /trainer
    __init__.py
    task.py

在/dist目录下,本地运行正常:

$ gcloud ml-engine local train 
    --package-path=trainer
    --module-name=trainer.task

现在,当尝试部署它时,在/dist 目录下使用以下命令:

$ gcloud ml-engine jobs submit training testA
    --package-path=trainer
    --module-name=trainer.task
    --staging-bucket=$JOB_DIR
    --region us-central1

它给了我一个错误“No moduled name trainer”

INFO    2017-04-13 12:28:35 -0700   master-replica-0        Installing collected packages: pyyaml, scipy, scikit-learn, trainer
INFO    2017-04-13 12:28:38 -0700   master-replica-0        Successfully installed pyyaml-3.12 scikit-learn-0.18.1 scipy-0.18.1 trainer-0.1
INFO    2017-04-13 12:28:38 -0700   master-replica-0        Running command: python -m trainer.task
ERROR   2017-04-13 12:28:38 -0700   master-replica-0        /usr/bin/python: No module named trainer

编辑: 这是setup.py的内容

from setuptools import find_packages
from setuptools import setup
REQUIRED_PACKAGES = [
    'pyyaml',
    'scipy==0.18.1',
    'scikit-learn'
]
setup(
    name='trainer',
    version='0.1',
    install_requires=REQUIRED_PACKAGES,
    include_package_data=True,
    description='Classifier test'
)

我做错了什么?

谢谢

中号

最佳答案

您在 setup.py 中缺少重要的一行,即 setup 函数调用的 packages 参数(参见 these instructions )。试试这个:

from setuptools import find_packages
from setuptools import setup
REQUIRED_PACKAGES = ['pyyaml','scipy==0.18.1','scikit-learn']
setup(
    name='trainer',
    version='0.1',
    install_requires=REQUIRED_PACKAGES,
    packages=find_packages(),
    include_package_data=True,
    description='Classifier test'
)

我已更新 CloudML 引擎 docs (可能需要几天的时间来传播)。

我使用 --package-path=trainer 和上述更改复制了您的命令,并且在云中正常运行。

最后,尽管它无害,但 dist/ 中的 __init__.py 是不必要的,可以安全地删除。

关于google-cloud-ml - 没有名为 trainer 的模块,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43400599/

相关文章:

tensorflow - 向 gcloud 提交训练作业时出错

tensorflow - 将 SavedModel 上传到 ML 引擎

tensorflow - 如何在 tf contrib estimator 中使用 GPU

python - gcloud ml-engine 在大文件上返回错误

python - FAILED_PRECONDITION : Error: SavedModel directory gs://mybucket1/is expected contain exactly one of [saved_model. pb,saved_model.pbtxt]

python - 运行图时出现异常: Unable to get element from the feed as bytes

c# - Google ML-Engine Predict from C# 身份验证问题

python - 如何为 Cloud ML Engine 打包词汇文件

stackdriver - 我们可以禁用 GCP Stackdriver 对日志行的截断吗?