hadoop - 配置单元更新,插入,删除

标签 hadoop hive

我一直在尝试根据instructions在 hive 表中实现UPDATE,INSERT,DELETE操作。但是,每当我尝试包含将完成工作的属性时,即为INSERT, UPDATE, DELETE hive.support.concurrency true(默认值为false)设置的配置值hive.enforce.bucketing true(默认值为false)hive.exec.dynamic.partition.mode nonstrict(默认值为strict)之后,如果我在hive shell上运行show tables,则需要65.15秒如果没有上述属性,则通常以0.18秒运行。除了show tables以外,其余命令均不提供任何输出,即直到我杀死进程为止,它们一直运行。你能告诉我原因吗?

最佳答案

Hive不是RDBMS。在相同的配置下,运行2分钟的查询可能会运行5分钟。 Hive和Hadoop都不保证我们执行查询所需的时间。另外,请提供有关您是在单节点群集还是多节点群集上运行的信息。并且还提供有关您要查询的数据大小的信息。您提供的信息不足。但是,不要根据执行查询的时间得出任何结论。因为确定查询的运行时间涉及很多因素,例如磁盘,CPU插槽,N / W等。

关于hadoop - 配置单元更新,插入,删除,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32220173/

相关文章:

hadoop - 使用hadoop处理非常小的文件

java - Hive 通用 UDTF 因数组索引越界错误而失败

java - Hive GUDF 自定义解压缩功能测试用例失败,错误为 "B cannot be cast to org.apache.hadoop.io.BytesWritable"

hadoop - super 用户未授权连接 : hcat"when trying to query Hive through WebHCat

java - Hadoop 文件系统中的通配符列出 API 调用

hadoop - 从配置单元到 teradata 的 Sqoop 导出不适用于时间戳字段

linux - 我怎样才能记忆起 shell 的历史?

hadoop - Pig 使用 LOAD 覆盖 hive 中的数据

hadoop - Hive 阶段 MapReduce

hadoop - 使用 Kerberos 安全连接到 Mapper 中的 HIVE