我一直在尝试根据instructions在 hive 表中实现UPDATE,INSERT,DELETE操作。但是,每当我尝试包含将完成工作的属性时,即为INSERT, UPDATE, DELETE hive.support.concurrency true
(默认值为false
)设置的配置值hive.enforce.bucketing true
(默认值为false
)hive.exec.dynamic.partition.mode nonstrict
(默认值为strict
)之后,如果我在hive shell上运行show tables
,则需要65.15秒如果没有上述属性,则通常以0.18秒运行。除了show tables
以外,其余命令均不提供任何输出,即直到我杀死进程为止,它们一直运行。你能告诉我原因吗?
最佳答案
Hive不是RDBMS。在相同的配置下,运行2分钟的查询可能会运行5分钟。 Hive和Hadoop都不保证我们执行查询所需的时间。另外,请提供有关您是在单节点群集还是多节点群集上运行的信息。并且还提供有关您要查询的数据大小的信息。您提供的信息不足。但是,不要根据执行查询的时间得出任何结论。因为确定查询的运行时间涉及很多因素,例如磁盘,CPU插槽,N / W等。
关于hadoop - 配置单元更新,插入,删除,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32220173/