delta-lake - 使用 delta 表的 VACUUM 会发生什么？

当我们运行 VACUUM 命令时，它是遍历每个 parquet 文件并删除每条记录的旧版本，还是保留所有 parquet 文件，即使它有一个最新版本的记录？压实呢？这有什么不同吗？

最佳答案

Vacuum 和 Compaction 遍历 Delta Lake Table 中的 _delta_log/ 文件夹并识别仍在引用的文件。

Vacuum 删除所有未引用的文件。压缩读取引用的文件并将新分区写回表，取消引用现有文件。

关于delta-lake - 使用 delta 表的 VACUUM 会发生什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/72993612/