azure - 在运行时从 Azure Data Bricks Pipeline 传递 Databricks ClusterID

标签 azure azure-data-factory azure-databricks

我希望使 Azure 链接服务可配置,从而在运行时传递 Databricks WorkspaceURL 和 ClusterID。我将拥有多个 Spark 集群,并根据集群的大小,我将调用集群的类型/大小。

我没有找到从 ADF 管道获取 DataBricks ClusterID 和 passit 的选项

Databricks Linked Service

enter image description here

最佳答案

您可以使用 REST API Clusters API 2.0 获取集群列表。

https://adb-7012303279496007.7.azuredatabricks.net/api/2.0/clusters/list

我复制了上面的内容并得到了下面的结果。

首先在databricks工作区中生成访问 token ,并在网络事件中使用该 token 作为获取集群列表的授权。

enter image description here

网络事件的输出:

enter image description here

上面还包含簇大小(以 mb 为单位)。将以上内容存储在数组变量中。

enter image description here

要根据集群大小获取所需的集群 ID,您可以根据您的要求使用过滤条件。

在这里,对于示例,我使用以 mb 为单位的簇大小作为过滤条件。

enter image description here

笔记本链接服务:

cluster_id 参数。

enter image description here

从过滤数组中传递所需的 cluster_id,如下所示。

@activity('Filter1').output.Value[0].cluster_id

enter image description here

您可以使用动态内容指定笔记本路径。

enter image description here

我的执行:

enter image description here

关于azure - 在运行时从 Azure Data Bricks Pipeline 传递 Databricks ClusterID,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/74207811/

相关文章:

sql - 如何在 Azure databricks SQL 中将字段值转换为逗号分隔

azure - Pyspark:动态添加一行到最终数据帧中

Azure Databricks - 无法将结果从 Databricks 导出到 blob

azure - 使用 Reader UMI : "Insufficient privileges to complete the operation" 获取 Azure 自动化下的 AzADUser

debugging - 本地 Azure 待办事项列表

sql - Synapse/ADF - 如果预复制脚本中的动态配置列为 True,如何截断表

azure - 如何在azure数据工厂中加入3列并将其作为单列

azure - 如何将脚本事件输出以 csv/结构化格式推送为接收器

azure - 我在将 Azure Active Directory 连接到 Wiki.js 时遇到问题

azure - 在参数文件中动态添加API连接