在数据流中,我有两个数据集,每个数据集一列。假设数据集 a 包含 a 列,数据集 b 包含 b 列。
我想交叉连接它们,但是当我选择自定义交叉连接选项时,它要求我指定一个条件。我不明白我需要在这里提供什么,我只想将 a 列中的所有记录与 b 列中的所有记录交叉连接。我应该放什么?我尝试查看 Microsoft 官方文档,但那里没有示例。
最佳答案
Azure 数据工厂数据流的 join
转换中的交叉联接需要一个必须应用联接的条件。我已完成以下操作来演示如何在您给出的示例中进行交叉连接。
- 我有两个数据集(每列一列)。数据集 A 有一列
a
,其中包含以下值。
- 数据集 B 的
b
列具有以下值。
- 我使用连接转换来连接两个源。现在,数据流联接转换会提示您指定交叉联接条件。如果您没有任何条件,只想对两个数据集中的所有数据应用交叉联接,则可以将交叉联接条件值指定为
true()
(如在这种情况下你想要做的)。
- 这将对
a 列
的所有记录与b 列
的所有记录应用交叉联接。
这就是您可以实现您的要求的方法。如果您有任何条件,您可以传递它以基于它应用交叉连接,而不是使用 true()
。引用这个official Microsoft documentation了解有关联接的更多信息。
关于azure - 我应该为 Azure 数据工厂数据流中的自定义交叉联接提供什么条件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72954695/