hadoop - 现有表的 Hive 分桶和分区

标签 hadoop hive

是否可以为已经包含数据的表创建分桶和分区?我在 hive 中有一个表,其中包含超过 100M 的记录,我想在该表上创建一个分区。我还需要创建分桶。

这可能吗?

谢谢, 巴拉

最佳答案

不,不可能在预加载的表中更改分桶和分区,您可能必须创建一个具有所需分桶和分区属性的新表,然后从旧表加载它。

set hive.enforce.bucketing = true;
FROM old_table insert into table new_bucketed_partitioned_table select * ;

关于hadoop - 现有表的 Hive 分桶和分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33734209/

相关文章:

hadoop - Hive 是否支持具有主键的 Uniqueidentifier 数据类型?

hadoop - 如何确定配置单元中的存储桶数

hadoop - 链接 Hadoop MapReduce 1.1.1 示例

hadoop - 从IBM db2到Hive的Sqoop导入

hadoop - 在Ubuntu上安装特定版本的hadoop-client

hadoop - Apache Kylin 无法找到 HBase 公共(public)库

hadoop - 与 Cloudera 和 Hortonworks 相比,Hadoop 发行版 MapR 有哪些缺点?

java - 通过 Flume 将 API 数据传输到 hadoop

hadoop - 使用Sqoop将数据从Teradata导入到Hive

hadoop - 如何在Hive中创建随机分区的数据