google-cloud-platform - 向 Google Dataflow 作业发送凭据

标签 google-cloud-platform google-cloud-dataflow

将凭据传递给 Dataflow 作业的正确方法是什么?

我的一些 Dataflow 作业需要凭据才能进行 REST 调用和获取/后处理数据。

我目前正在使用环境变量将凭据传递给 JVM,将它们读入一个 Serializable 对象并将它们传递给 DoFn 实现的构造函数。我不确定这是正确的方法,因为任何可序列化的类都不应该包含敏感信息。

我想到的另一种方法是将凭证存储在 GCS 中并使用服务帐户 key 文件检索它们,但想知道为什么我的工作要执行从 GCS 读取凭证的任务。

最佳答案

Google Cloud Dataflow 没有对传递或存储安全 secret 的 native 支持。但是,您可以使用 Cloud KMS 和/或 GCS,因为您建议使用 Dataflow 服务帐户凭据在运行时读取 secret 。

如果您在运行时从 DoFn 读取凭证,您可以使用 DoFn.Setup 生命周期 API 读取一次值并在 DoFn 的生命周期内缓存它.

您可以在此处了解 Google Cloud 中 secret 管理的各种选项:Secret management with Cloud KMS .

关于google-cloud-platform - 向 Google Dataflow 作业发送凭据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49532987/

相关文章:

javascript - 我可以使用服务帐户对我网站上的用户进行身份验证,使他们能够查看我的 Google 云端硬盘中的选定文件吗?

python - 添加requirements.txt [Python]时数据流失败

r - 谷歌云AI平台jupyter notebook实例重启后也打不开,正在运行

google-app-engine - 带有 SignedURL 的 CORS

apache-spark - 数据流 SparkPipelineRunner - 有可用的示例吗?

tensorflow - 我可以将辅助输入传递给 Apache Beam PTransforms 吗?

java - 分析在 Google Dataflow 上运行的 Java 应用程序

google-bigquery - 尝试将日期时间值从 Dataflow 插入 BigQuery 时出现无效的日期时间错误

amazon-web-services - 如何通过http触发器从AWS SNS触发GCP云功能(私有(private))

docker - 无法使用没有外部 IP 地址的容器镜像创建 Google Compute Engine 虚拟机