我是 hadoop 和 hive 的新手。我想删除我的数据库中的某些行——它在 hive-hadoop 上。我知道它不支持开箱即用,而且 hadoop 是一个只读文件系统。我很好奇实现这一目标的最佳方法是什么。如果有人以前这样做过,他们可以分享他们的学习/过程吗?
谢谢!
最佳答案
在大数据中确实没有删除。也就是说,如果表或分区不是太大,您可以覆盖它,或者像 JamCon 建议的那样将删除隔离到特定分区。
对于不太大的数据集,你可以这样做
INSERT OVERWRITE TABLE mytable
SELECT * FROM mytable
WHERE ID NOT IN ( 'delete1', 'delete2', 'delete3');
关于hadoop - 如何删除hive hadoop数据库中的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22623270/