hadoop - 向现有 HIVE 表添加一列会产生什么后果?

标签 hadoop hive schema

假设在开始使用 HIVE 之后有几百个 Gig,我想添加一个列。 从我看到的各种文章和页面来看,我无法理解

  • 需要存储空间(双?)
  • 阻塞(我还能在其他进程中读表吗)?
  • 时间(与 Mysql 的变化一样快还是一样慢?)
  • 底层存储(我需要更改所有底层文件吗?如何使用 RCFile 完成?)

能够在 HIVE 专栏中回答关于结构的相同问题的人将获得奖励。

最佳答案

如果您向配置单元表中添加一列,则只会更新底层元存储。

  • 只要不添加数据,所需的存储空间就不会增加
  • 可以在其他进程访问表时进行更改
  • 变化非常快(只更新底层元存储)
  • 您不必更改基础文件。现有记录的新列值为空

希望对您有所帮助。

关于hadoop - 向现有 HIVE 表添加一列会产生什么后果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5065801/

相关文章:

scala - 将数据框转换为 spark scala 中的配置单元表

hadoop - 是否有任何属性来定义失败的映射器阈值

Hadoop & Hive 作为仓库 : daily data deliveries

sql - 不区分大小写的架构对象名称,带有区分大小写的比较

database - 如何在 Prisma 模式中表示额外的关系列?

hadoop - 使用分区创建外部

hadoop - 在 hadoop 上配置超表运行时,DfsBroker 无法启动错误

sql - 多表左半加入 Hive

hadoop - 在Hive更新期间HDFS中发生了什么(真的)?

json - 将具有不同模式的 json 加载到 PIG 中