azure - 如何使用 Azure 数据工厂删除文件中的重复项，而不使用 Dataflow 或 Databricks 或 Azure datalake 分析

标签 azure azure-data-factory

我正在创建一个数据管道，将数据从一个文件复制到另一个文件。我的输入文件有 4 列，输出文件有 2 列。我只想复制输入文件的第 1 列和第 3 列并将其存储在输出文件中。复制后，我想从输出文件中删除重复项。但我无法使用 Dataflow、Databricks 或 Azure datalake 分析，因为我的设置中没有计算。有没有什么方法可以不使用计算来做到这一点？

最佳答案

您需要一个用于重复数据删除的计算环境。 ADF 管道库中有针对不同行和重复数据删除的预构建模式。

关于azure - 如何使用 Azure 数据工厂删除文件中的重复项，而不使用 Dataflow 或 Databricks 或 Azure datalake 分析，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61381768/

上一篇：azure - 如何仅向一个 Azure 服务总线订阅发送消息？

下一篇：python - 是否可以使用 Python SDK 检查特定 Azure blob 上是否有租约？

azure - Apache Nifi 多处理器到相同关系

Azure 数据工厂导入多个有值(value)的查找字段

azure - 在 Azure 数据工厂中创建 SnowFlake 链接服务时出现索引超出范围错误

Azure数据工厂-数据流-完成后-移动

sql-server - 如何在 SQL 中创建临时表以在多个 ADF 事件中使用？

c# - 使用c#备份和恢复Azure sql数据库

.net - Azure Web App自动切换服务器？

azure - 使用 Azure Keyvault SignData 进行 SignedXml

azure - 我可以更改现有数据工厂的 ARM 模板吗？