我是Hadoop和Hbase的新手。我想知道是否有一种方法可以对hbase表中的某些选定数据区域进行Map Reduce。我的意思是,有没有一种方法可以指定Map减少的表区域,而不是选择完整的表并根据区域数拆分任务。一些代码片段将有很大的帮助。
非常感谢。
最佳答案
您可以设置处理的开始行和结束行。如果执行一次,则可以在HBase Web UI中获得该区域的开始和停止键。
可以使用TableMapReduceUtil来完成,它接受扫描作为参数。在内部(我认为)它将setStartRow和setStopRow调用为TableInputFormat)
在这里您可以找到示例:
http://massapi.com/class/org/apache/hadoop/mapreduce/Job.java.html(在页面中搜索setStartRow)。
关于hadoop - 映射从hbase表中减少特定区域的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11201129/