hadoop - 向现有 HIVE 表添加一列会产生什么后果？

标签 hadoop hive schema

假设在开始使用 HIVE 之后有几百个 Gig，我想添加一个列。从我看到的各种文章和页面来看，我无法理解

需要存储空间(双？)
阻塞(我还能在其他进程中读表吗)？
时间(与 Mysql 的变化一样快还是一样慢？)
底层存储(我需要更改所有底层文件吗？如何使用 RCFile 完成？)

能够在 HIVE 专栏中回答关于结构的相同问题的人将获得奖励。

最佳答案

如果您向配置单元表中添加一列，则只会更新底层元存储。

只要不添加数据，所需的存储空间就不会增加
可以在其他进程访问表时进行更改
变化非常快(只更新底层元存储)
您不必更改基础文件。现有记录的新列值为空

希望对您有所帮助。

关于hadoop - 向现有 HIVE 表添加一列会产生什么后果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5065801/

上一篇：hadoop - MapReduce 中 1 个任务的 reducer 数量

下一篇：hadoop - hive 表锁

相关文章：

scala - 将数据框转换为 spark scala 中的配置单元表

hadoop - 是否有任何属性来定义失败的映射器阈值

Hadoop & Hive 作为仓库 : daily data deliveries

sql - 不区分大小写的架构对象名称，带有区分大小写的比较

database - 如何在 Prisma 模式中表示额外的关系列？

hadoop - 使用分区创建外部

hadoop - 在 hadoop 上配置超表运行时，DfsBroker 无法启动错误

sql - 多表左半加入 Hive

hadoop - 在Hive更新期间HDFS中发生了什么(真的)？

json - 将具有不同模式的 json 加载到 PIG 中

©2024 IT工具网联系我们