假设在开始使用 HIVE 之后有几百个 Gig,我想添加一个列。 从我看到的各种文章和页面来看,我无法理解
- 需要存储空间(双?)
- 阻塞(我还能在其他进程中读表吗)?
- 时间(与 Mysql 的变化一样快还是一样慢?)
- 底层存储(我需要更改所有底层文件吗?如何使用 RCFile 完成?)
能够在 HIVE 专栏中回答关于结构的相同问题的人将获得奖励。
最佳答案
如果您向配置单元表中添加一列,则只会更新底层元存储。
- 只要不添加数据,所需的存储空间就不会增加
- 可以在其他进程访问表时进行更改
- 变化非常快(只更新底层元存储)
- 您不必更改基础文件。现有记录的新列值为空
希望对您有所帮助。
关于hadoop - 向现有 HIVE 表添加一列会产生什么后果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5065801/