与外部表相比,Delta Lake 中的内部表是否有任何性能优势,因为这两种情况下源文件都驻留在 Data Lake 中?
最佳答案
托管表与非托管表之间应该没有太大区别。它们的区别仅在于路径(默认存储位置与显式指定)以及删除表时发生的情况(同时删除数据与仅删除表定义)。
2023 年 10 月更新:当您使用 Unity Catalog 时,情况可能会有所不同 - 现在,托管表可以具有更多功能,例如自动维护等。但它最终也应该出现在外部表中。
关于apache-spark - Delta Lake 中的外部表与内部表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73688958/