我有一个非常简单的训练器,它遵循示例目录结构:
/dist
__init__.py
setup.py
/trainer
__init__.py
task.py
在/dist目录下,本地运行正常:
$ gcloud ml-engine local train
--package-path=trainer
--module-name=trainer.task
现在,当尝试部署它时,在/dist 目录下使用以下命令:
$ gcloud ml-engine jobs submit training testA
--package-path=trainer
--module-name=trainer.task
--staging-bucket=$JOB_DIR
--region us-central1
它给了我一个错误“No moduled name trainer”
INFO 2017-04-13 12:28:35 -0700 master-replica-0 Installing collected packages: pyyaml, scipy, scikit-learn, trainer
INFO 2017-04-13 12:28:38 -0700 master-replica-0 Successfully installed pyyaml-3.12 scikit-learn-0.18.1 scipy-0.18.1 trainer-0.1
INFO 2017-04-13 12:28:38 -0700 master-replica-0 Running command: python -m trainer.task
ERROR 2017-04-13 12:28:38 -0700 master-replica-0 /usr/bin/python: No module named trainer
编辑: 这是setup.py的内容
from setuptools import find_packages
from setuptools import setup
REQUIRED_PACKAGES = [
'pyyaml',
'scipy==0.18.1',
'scikit-learn'
]
setup(
name='trainer',
version='0.1',
install_requires=REQUIRED_PACKAGES,
include_package_data=True,
description='Classifier test'
)
我做错了什么?
谢谢
中号
最佳答案
您在 setup.py 中缺少重要的一行,即 setup
函数调用的 packages
参数(参见 these instructions )。试试这个:
from setuptools import find_packages
from setuptools import setup
REQUIRED_PACKAGES = ['pyyaml','scipy==0.18.1','scikit-learn']
setup(
name='trainer',
version='0.1',
install_requires=REQUIRED_PACKAGES,
packages=find_packages(),
include_package_data=True,
description='Classifier test'
)
我已更新 CloudML 引擎 docs (可能需要几天的时间来传播)。
我使用 --package-path=trainer
和上述更改复制了您的命令,并且在云中正常运行。
最后,尽管它无害,但 dist/
中的 __init__.py
是不必要的,可以安全地删除。
关于google-cloud-ml - 没有名为 trainer 的模块,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43400599/