git - Azure Databricks - 自动同步存储库文件

标签 git azure databricks azure-databricks databricks-repos

在 Azure Databricks 中,我可以通过控制台在手动归档的存储库中添加不同的 git 存储库。但如果我在源存储库中提交了任何内容,则无法找到任何自动同步新文件的方法。 Azure中有没有可以完成此类工作的服务?谢谢

最佳答案

您可以通过 Repos API 更新存储库,具体通过update command (即使存储库已经在分支上,再次调用它也会 pull 更改)。另一种选择是使用 Databricks CLI,它也有 corresponding command to update repository .

您可以在 Github Action 或 Azure DevOps 中设置一些 CI/CD 管道,以便在提交发生时更新您的 Databricks 存储库。这是an example for Azure DevOps .

关于git - Azure Databricks - 自动同步存储库文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72890489/

相关文章:

apache-spark - 通过多个作业同时更新三角洲湖表

git status 将 "\n\n"显示为未跟踪文件

git - 为什么 Jenkins 收到 git submodule update 的 Authentication Failed 错误?

azure - 为什么 azure 工件包含所有引用第三个包

visual-studio-2010 - Visual Studio 2010 无法打开 Web 浏览器,每次都告诉我重新启动 Windows

node.js - 如何在 NodeJS 中的代理后面使用 DocumentDB

azure - 如何将触发器参数传递到Azure数据工厂中的笔记本

jupyter-notebook - 使用 Databricks 连接

git - Visual Studio 2019 在创建新的 Git 存储库时没有 GitLab 选项

python - 添加另一个项目的子目录作为子树