hadoop - HDFS上的HBase更新操作

标签 hadoop hbase hadoop2

因为HBase基于HDFS,并且HDFS不具有更新功能,所以我想知道它的更新操作是否会重写hadoop上的整个HFILE文件?

谢谢

最佳答案

HBase中没有更新。

在HBase(整个行或特定单元格)中执行删除时,特殊的删除标记将添加到单元格中。即将进行的扫描或获取操作将看不到该单元格。

执行插入时,您只需使用当前时间戳创建一个新单元格。扫描和获取操作将返回单元的较新版本。

在HBase major compactions.期间执行实际的物理删除。此外,减少了HFile的压缩数量以提供更快的读取操作。

关于hadoop - HDFS上的HBase更新操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42677201/

相关文章:

scala - 用于 TB 级结构化数据的 Greenplum、Pivo​​tal HD + Spark 或 HAWQ?

python - 安排 pyspark 笔记本

hadoop - 运行具有高可用性的 Hadoop 集群的最低系统要求

hadoop - 如何检索 Hdfs 文件中的复制因子信息?

hadoop - 用于解析 aws elb 日志的 pig 脚本

hadoop - 计算Hadoop Hive中多个列的平均值

hadoop - 在 Cassandra 数据库中跨集群复制数据

java - 附加到 HBase TableMapper 返回值的额外字节

hadoop - Exasol 与 HBase

r - HBase 键值 (NOSQL) 到 Hive 表 (SQL)