最初设置新的 EMR 集群并向集群添加步骤时,它们附加到页面的顺序是自上而下,这意味着顶部条目首先运行,底部条目最后运行。
当您在正在运行的 EMR 集群中观察这些步骤的进度时,它们是自下而上运行的,这意味着底部首先运行,顶部最后运行。
当我导出用于集群设置的 CLI 命令并通过 DataPipeline 运行该命令时,它包含 --steps 标志,其中包含一系列步骤,第一个运行的步骤是数组中的最后一项。
不用说,我非常困惑如何为我正在执行的 ETL 工作强制执行特定步骤的顺序。
有没有办法明确指定这些步骤的顺序?
最佳答案
它们确实按照您通过 API 指定的顺序运行,但由于某种原因,Web 控制台在显示它们时有奇怪的排序。
关于amazon-web-services - EMR 步骤的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40061212/