azure - 有没有办法在管道之间创建依赖关系? (单个管道依赖于其他 3 个管道)

标签 azure pipeline azure-data-factory

我的 Azure 数据工厂上有 5 个管道,每个管道将数据复制到不同的表。其中一些表存在依赖关系,表 D 和 E 依赖于表 A、B 和 C。如本例所示:

Table dependencies & Pipelines

我刷新所有数据的执行顺序如下:

到表 A 的执行管道 > 到表 B 的执行管道 > 到表 C 的执行管道 > 到表 D 的执行管道 > 到表 E 的执行管道。

Pipelines Execution Order

我可以在执行到表 D 的管道之前执行到表 E 的管道,没有任何问题,但是它们都不能在表 A、B 和 C 的管道之前执行。

我必须让这个更有条理、更容​​易安排的想法是更改管道 D 并添加 3 个步骤来执行表 A、B 和 C 的管道。在表 E 的管道上,我添加了一个执行步骤管道 D。如示例所示:

Pipelines Idea

但是,这会创建表 E 与表 D 的某种依赖关系,这是我不想要的。如果我出于任何原因需要只更新表 E,它将无法完成,因为我需要先更新表 D。

我希望到表 D 和 E 的管道都具有某种验证,如果到表 A、B 和 C 的管道已经运行,那么它们就可以运行。

有没有办法让这种依赖关系更有组织性?

最佳答案

要使管道相互依赖,您可以创建一个触发器并使这些触发器依赖于其他触发器。

要创建依赖管道,我们可以使用Tumbling window trigger

通过管道传输到表 A、B、C 创建触发器

Trigger >> New/Edit >> Choose Trigger >> New >> Type-Tumbling window >> Configure Properties >>Save

使到表D、E的管道依赖于到表A、B、C的管道

Select Trigger > Advanced > New, then choose the trigger to rely on with the proper offset and size. This will create dependent on the trigger.

示例

enter image description here

In above example Trigger 4 is created for pipeline 4 And in Dependencies added Trigger 1, 2, 3 which are created for pipeline 1, 2, 3 respectively.

此依赖的翻滚窗口触发器仅在服务内的另一个触发器成功执行时执行。

关于azure - 有没有办法在管道之间创建依赖关系? (单个管道依赖于其他 3 个管道),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73141844/

相关文章:

azure - 通过 bicep 使用托管身份的 API 连接( keystore 、服务总线和 blob)

c# - Azure Function 与 CosmosDb 绑定(bind)正确的本地设置

azure - NLog 将 UTC 转换为 Azure 中的本地时区?

linux - 使用行字段排序命令输出

python - PySpark:组合两个 VectorAssembler 的输出

Azure 数据工厂 - 对第一个切片执行完整的 IDL

azure - Postman URL 路径参数中的引号字符

python - FeatureUnion ,管道分类特征与 tfidf 特征抛出错误

azure - ADF Dataflow 如何从单独的数组读取列和行并生成 csv 文件

azure - 数据工厂中的 U-SQL 作业失败