当我们运行 VACUUM
命令时,它是遍历每个 parquet 文件并删除每条记录的旧版本,还是保留所有 parquet 文件,即使它有一个最新版本的记录?压实呢?这有什么不同吗?
最佳答案
Vacuum 和 Compaction 遍历 Delta Lake Table 中的 _delta_log/
文件夹并识别仍在引用的文件。
Vacuum 删除所有未引用的文件。 压缩读取引用的文件并将新分区写回表,取消引用现有文件。
关于delta-lake - 使用 delta 表的 VACUUM 会发生什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72993612/