hadoop - 在 Hbase 表上插入后重新计算某些列

标签 hadoop hbase

有没有一种简单的方法可以在插入发生后重新计算一些值?我有一个包含多个列族的表,其中一个是统计列族。我想插入原始记录,而不是使用一些特定于 HBase 的工具来离线计算值 - 而不会阻止插入。

假设我将一些文件放入 hbase 表中,并希望获得有关其中行数以及存储在那里的日期的信息。

我一直在研究 RegionObserver 及其 preGet 方法。此解决方案有效,但恐怕它会阻止实际插入发生,直到计算完成。

最佳答案

使用 postPut 方法。可以看一下HBase的协处理器简介here

关于hadoop - 在 Hbase 表上插入后重新计算某些列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10088370/

相关文章:

Apache oozie sharedlib 显示空白列表

hadoop - Hbase HMaster 未运行

mysql - Cassandra 或 Hadoop Hive 或 MYSQL?

java - hbase 导出到平面文件

hadoop - pig - 从远程 hbase 服务器读取/写入数据

hadoop - 连接同一行中的3个文本变量

Hadoop 演示代码不工作

hadoop将分区分配给reducer

hadoop - MapReduce:Map-only 还是 Reduce-only?

apache-spark - 将关系数据存储在hadoop中以进行分析