python - 无法从 python 文件运行 azure databricks

标签 python azure azure-databricks

我想从 python 文件运行 azure databricks 笔记本,我有 client_id、secret 和 token id。我尝试通过创建 databricks 客户端来运行它,但似乎没有可以运行 databricks 笔记本的包。 TIA 如有任何建议

答案应该像我们运行数据工厂一样运行数据砖笔记本,就像这段代码一样

adf_client = DataFactoryManagementClient(credentials, subscription_id)
run_response = adf_client.pipelines.create_run(rg_name, df_name, df_pipeline_name, parameters=...............

pipeline_run = adf_client.pipeline_runs.get(rg_name, df_name, run_response.run_id)
status = pipeline_run.status
    
while status == 'Queued' or status == 'InProgress':
    time.sleep(5)
    status = adf_client.pipeline_runs.get(rg_name, df_name, run_response.run_id).status

最佳答案

您可以使用 databricks Rest API 来触发 databricks 作业。您必须首先使用集群和笔记本配置作业。

您可以查看this blog这证明了这一点。该博客讨论了通过 postman 调用 API。您只需将其替换为 python 代码即可。

触发作业的官方databricks Rest API文档可以找到hereDatabricks documentation还展示了如何使用 python 代码调用 API。

您可以使用 databricks token 或 AAD 不记名 token 进行授权。

关于python - 无法从 python 文件运行 azure databricks,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75206084/

相关文章:

c# - 缩放时 Azure 服务总线唯一订阅名称

azure - Databricks/Spark 错误 - 依赖项更新?

Azure Databricks : ImportError: No module named azure. storage.blob

python - python : InvalidMatch 中的正则表达式模式

c# - Azure 媒体服务 Assets 管理

python 读取文件夹中的所有文件,但名为 "xyz"的文件除外

azure - 如何使用 terraform 将 AKS 主日志发送到 eventhub?

azure-data-lake - 从数据 block 连接到数据湖(ADLS Gen2)存储时出错

python - TypeError : Tensors in list passed to 'values' of 'ConcatV2' Op have types [bool, float32] 不完全匹配

python - 使用 Python 生成包含列表中单词的句子生成器