databricks - Azure Databricks 群集问题

标签 databricks azure-databricks

我是天蓝色的新手,正在尝试了解以下内容。如果任何人都可以分享他们的知识,将会很有帮助。

  1. 如果集群 A 宕机,集群 B 中是否可以访问在集群 A 中创建的表?
  2. 簇和表中的数据之间有什么联系? enter image description here

最佳答案

您需要有正在运行的进程(集群)才能访问元存储并读取数据,因为数据存储在客户的位置,无法从运行 UI 的控制平面直接访问。

当您将数据写入表时,在以下条件下,该数据应该在其他集群中可用:

  • 两个集群使用相同的元存储
  • 用户拥有正确的权限(可以通过表 ACL 强制执行)

关于databricks - Azure Databricks 群集问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66803901/

相关文章:

python - 从 Azure Databricks 删除 SQL 数据库中的表

azure - 使用 pyspark 将多个 csv 文件合并到 Azure Blob 存储中的一个 csv 文件

python - 将spark转换为pandas数据帧有异常: arrow is not supported when using file-based collect

azure - 从 Databricks 到 Azure 存储帐户和容器的访问控制

python - Azure Databricks 中的多重处理

python - 在 Databricks 笔记本中使用用 Python 编写的自定义函数

databricks - 如何解决 Databricks SQL 编辑器中的算术溢出错误

sql - Azure Databricks - 使用考拉读取表格

Azure Databricks SCIM 配置

python - 在 Pyspark 中读取和保存图像文件