hadoop - 如何删除hive hadoop数据库中的行

标签 hadoop hive delete-row

我是 hadoop 和 hive 的新手。我想删除我的数据库中的某些行——它在 hive-hadoop 上。我知道它不支持开箱即用,而且 hadoop 是一个只读文件系统。我很好奇实现这一目标的最佳方法是什么。如果有人以前这样做过,他们可以分享他们的学习/过程吗?

谢谢!

最佳答案

在大数据中确实没有删除。也就是说,如果表或分区不是太大,您可以覆盖它,或者像 JamCon 建议的那样将删除隔离到特定分区。

对于不太大的数据集,你可以这样做

INSERT OVERWRITE TABLE mytable
SELECT * FROM mytable
WHERE ID NOT IN ( 'delete1', 'delete2', 'delete3');

关于hadoop - 如何删除hive hadoop数据库中的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22623270/

相关文章:

database - Hive或HBase或任何其他选项?

c# - 查询表达式 ""中的语法错误(缺少运算符)

hadoop - 当节点数少于复制因子时HDFS如何进行复制?

Hadoop Hbase 工作流程

hadoop - Hive JDBC Kerberos 连接错误

sql - 获取 Hive 中所有列的 NULL 百分比

hadoop - HDFS:上传后未分发文件

csv - 如何在 pig 中使用CSVLoader或CSVExcelStorage用双引号上载csv数据

c# - 删除数据集中的空行

MySQL删除 'expiry'之后的行