是否可以为已经包含数据的表创建分桶和分区?我在 hive 中有一个表,其中包含超过 100M 的记录,我想在该表上创建一个分区。我还需要创建分桶。
这可能吗?
谢谢, 巴拉
最佳答案
不,不可能在预加载的表中更改分桶和分区,您可能必须创建一个具有所需分桶和分区属性的新表,然后从旧表加载它。
set hive.enforce.bucketing = true;
FROM old_table insert into table new_bucketed_partitioned_table select * ;
关于hadoop - 现有表的 Hive 分桶和分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33734209/