azure - 如何在 Azure 数据流中复制 "MultiRow"转换的 Alteryx 逻辑

标签 azure azure-data-factory

我在 Alteryx(ETL 工具)中有一个工具,其中有一个名为“多行”的转换,它执行以下操作: 工具配置:

对其作用的解释: 如果列有 null ,则它取一行后面的值。由于“2012”位于每个 null 后面,因此它用“2012”填充所有内容。

如何在 Azure 数据流中实现此目的? enter image description here

输入数据:enter image description here

输出数据:enter image description here

最佳答案

您可以在数据流中使用窗口转换,用之前的值填充空值。我用示例输入数据进行了复制,下面是方法。

  • 输入数据是这样获取的。 enter image description here

  • 派生列添加了一个名为 dummy 的虚拟列,所有行的值为 1

enter image description here

  • 代理键是为 Windows 转换中的排序列创建的。 (如果您有任何用于排序的字段,请在 Windows 转换中使用该字段。)

代理键设置:

Key name: sk 
Start value: 1
Step value: 1

enter image description here

  • 进行 Windows 转换并给出设置
1. over: dummy
2. sort:  sk ascending
3. Range by : unbounded
4. windows column: year = coalesce(year, last(year, true()))

gifwindowstransformation

结果:

enter image description here

您可以使用选择转换并仅选择所需字段并丢弃虚拟字段。

关于azure - 如何在 Azure 数据流中复制 "MultiRow"转换的 Alteryx 逻辑,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75841393/

相关文章:

Azure数据工厂映射数据流: Epoch timestamp to Datetime

azure - 列出 Azure 中的所有部署槽

azure - Azure 数据工厂的凭据管理器不起作用

azure - 数据工厂 - 数据流 REST 分页

azure - 如何使用我的 Azure 免费帐户列出 Graph Explorer 中的所有应用程序?

azure - ADF 到 Snowflake 增量负载和流

python - 如何使用 azure 函数编辑 azure blob 存储中的 *.csv 文件?

python - 如何使用 python SDK 从 Azure Batch 计算节点检索 stdout/stderr.txt 文件?

c# - Azure 服务总线 AutoDeleteOnIdle

Azure Powershell 无密码身份验证