amazon-web-services - EMR 步骤的顺序

标签 amazon-web-services amazon-emr amazon-data-pipeline

最初设置新的 EMR 集群并向集群添加步骤时,它们附加到页面的顺序是自上而下,这意味着顶部条目首先运行,底部条目最后运行。

当您在正在运行的 EMR 集群中观察这些步骤的进度时,它们是自下而上运行的,这意味着底部首先运行,顶部最后运行。

当我导出用于集群设置的 CLI 命令并通过 DataPipeline 运行该命令时,它包含 --steps 标志,其中包含一系列步骤,第一个运行的步骤是数组中的最后一项。

不用说,我非常困惑如何为我正在执行的 ETL 工作强制执行特定步骤的顺序。

有没有办法明确指定这些步骤的顺序?

最佳答案

它们确实按照您通过 API 指定的顺序运行,但由于某种原因,Web 控制台在显示它们时有奇怪的排序。

关于amazon-web-services - EMR 步骤的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40061212/

相关文章:

amazon-web-services - 为什么 AWS ECS Fargate 没有实例类型?

amazon-web-services - Kafka 在 AWS 集群超时时创建主题

java - 使用 Java SDK 从 AWS EMR 集群获取 Master 公共(public) DNS 值

amazon-ec2 - 在 Pipeline 的 EMR 集群中标记 EC2 机器(S3->DynamoDB 示例中的 ImportCluster)

amazon-rds - 无法建立与 jdbc 的连接 :mysql communication link failure

python - Django S3 Direct 上的 CORS 错误

java - AWS Lambda RequestHandler 用于无效输出

amazon-web-services - 降低亚马逊 EMR 上 100% Cpu 利用率的 Hive 技巧

amazon-web-services - 如何使 Pyspark 脚本在 Amazon EMR 上运行以识别 boto3 模块?它说找不到模块

mysql - AWS Datapipeline - 重音字符问题