amazon-web-services - EMR 步骤的顺序

标签 amazon-web-services amazon-emr amazon-data-pipeline

最初设置新的 EMR 集群并向集群添加步骤时,它们附加到页面的顺序是自上而下,这意味着顶部条目首先运行,底部条目最后运行。

当您在正在运行的 EMR 集群中观察这些步骤的进度时,它们是自下而上运行的,这意味着底部首先运行,顶部最后运行。

当我导出用于集群设置的 CLI 命令并通过 DataPipeline 运行该命令时,它包含 --steps 标志,其中包含一系列步骤,第一个运行的步骤是数组中的最后一项。

不用说,我非常困惑如何为我正在执行的 ETL 工作强制执行特定步骤的顺序。

有没有办法明确指定这些步骤的顺序?

最佳答案

它们确实按照您通过 API 指定的顺序运行,但由于某种原因,Web 控制台在显示它们时有奇怪的排序。

关于amazon-web-services - EMR 步骤的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40061212/

相关文章:

laravel - 使用 git-codecommit 拒绝 aws 权限(公钥)

amazon-web-services - 将数据从 Hive 写入 Amazon S3,同时保持表分区目录结构

Java AWS S3 : Why S3Object. ObjectMetadata.ContentMD5 为空,而 S3Object.ObjectMetadata.Etag 不为空

amazon-web-services - 如何在CloudWatch中将值传递给Lambda函数?

python - 在 Amazon EMR 上安装 PIG 0.14

amazon-web-services - Amazon Elastic Map Reduce - 让服务器保持事件状态?

python - MRJob: socket.error: [Errno 104] 连接被对端重置

apache-spark - AWS EMR Spark : Error: Cannot load main class from JAR

mysql - 将空格作为 NULL 插入 MySQL

amazon-web-services - 如何在 hive (AWS Data Pipeline) 中使用 scriptVariables