python - Dataflow SDK 2.7.0,同时附加安装程序 2.10.0

标签 python google-cloud-platform sdk google-cloud-dataflow apache-beam

我正在尝试运行数据流作业,具有以下 setup.py 文件:

import setuptools

setuptools.setup(
              name='Some-Name',
              version='0.0.1',
              install_requires=[
                  'apache-beam==2.10.0',
                  'tensorflow-transform==0.12.0'
                  ],
              packages=setuptools.find_packages(),
              )

但是当我将作业提交到 GCP 时,SDK 显示为 2.7.0 并且作业无法运行。 1 小时后它将停止并出现以下错误:

工作流程失败。原因:Dataflow 作业似乎被卡住,因为在过去 1 小时内没有看到工作线程事件。

最佳答案

我通过更新我提交数据流作业的本地虚拟环境中的 tensorflow-transform 和 apache-beam 解决了这个问题。一旦我更新了本地 apache-beam 和 tensorflow-transformtensorflow,它似乎就可以工作了。我不知道为什么,因为 setup.py 说明了软件包的版本。

关于python - Dataflow SDK 2.7.0,同时附加安装程序 2.10.0,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55214898/

相关文章:

python - 使用函数和循环创建子图

go - 使用Go通过GCP发布/订阅设置Gmail推送通知

ios - 在 Facebook 页面上发布视频

android - 适用于 Android 的 Tumblr SDK(或 Sharekit)是否存在?

python - Django:检测未使用的模板

Python:突破 SteamCMD 提示符

python - 如何中断 Mac 上后台运行的 python 脚本?

google-app-engine - 在 Google Cloud 灵活环境或标准环境之间进行选择

google-cloud-platform - 谷歌云sdk环境变量

iphone - 我应该学什么: Quartz or OpenGL ES?