azure - 通过 Azure 数据工厂从 ftp 站点获取 zip 和非压缩文件 - 解压缩

标签 azure unzip azure-data-factory

我成功地通过 Azure 数据工厂从 ftp 站点获取文件并在此过程中解压缩它们。我正在为 ZipDeflate 设置源数据集。但是,现在我有一个类似的管道,我必须从 ftp 站点获取文件,其中混合了 .zip 文件和其他文件类型(如 .csv 和 .xls)。

当我尝试对 Copy 事件执行 ZipDeflate 时,它​​想要“缩小”所有文件(而不仅仅是 .zip)。我有点预料到了。我认为唯一想要解压缩 .zip 文件而不解压缩 .xls 和 .csv 文件的方法是在单独的复制事件中执行它们(一个用于需要解压缩的文件,一个用于所有其他文件)....是这样吗是的,还是有另一种方法可以在一项事件中完成这一切?

谢谢!! J

最佳答案

嗯,是的。您需要进行两次复制事件。但在这种情况下,我猜您将拥有两个具有不同文件过滤器的源数据集。 (第一个用于 .zip,第二个用于所有其他) 我想到的是使用元数据事件来获取文件名。之后,在 IF 条件下检查文件名是否包含“.zip”,则继续进行解压缩事件,如果为 false,则继续进行解压缩事件。这样,您仅使用一个数据集来收集所有文件,而不是单独使用。 希望这可以工作并帮助你。 :)

https://learn.microsoft.com/en-us/azure/data-factory/control-flow-get-metadata-activity

关于azure - 通过 Azure 数据工厂从 ftp 站点获取 zip 和非压缩文件 - 解压缩,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50633271/

相关文章:

wcf - Azure 服务总线中继 - 监控请求流量

linux - 在 Linux 中解压缩文件时如何避免跳过不正确的密码?

csv - oozie-在配置单元操作中使用存档文件

azure - 仅具有 IP 地址的 Azure 负载均衡器中的 backendAddressPool 无法部署

azure - 如何扩展 Azure Webjobs

azure - 在 Azure DevOps 管道中创建版本时获取 "The remote server returned an error: (401) Unauthorized."

windows - Ansible win_unzip 模块需要很长时间

azure - 在 Azure 数据工厂中解压缩 .Z 文件

azure - 复制前如何转换列?

azure - 数据流表达式生成器最大最大整数 ADF