我已经开始阅读 Databricks 推出的 Unity Catalog。我了解它试图解决的基本问题,但我不了解目录到底是什么。
这在 Databricks 文档中可用,
A catalog contains schemas (databases), and a schema contains tables and views.
https://docs.databricks.com/data-governance/unity-catalog/create-catalogs.html
这个添加的层(在模式之上)有何帮助?我猜这与治理有关?
如果可能的话,我真的很感激。
最佳答案
实际上,Catalog 是更大对象中的另一个数据管理层 - Unity Catalog Metastore。目录最接近的类比是单个 Hive Metastore——它还包含包含表和 View 的数据库(模式)。目录可用于将某些实体(业务单元/项目/环境(dev、stagin、prod)/...)的对象与其他实体的对象隔离开来。您可以将目录的管理权限授予业务部门、项目等的相应管理员,然后他们可以分配对各个模式和表/ View 的权限。
关于databricks - Databricks 中的目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72913371/