hadoop - 将数据加载到HBase

标签 hadoop mapreduce hbase

我从mapreduce的输出看起来像这样,作为具有数千条记录的关键值巴黎

    aa      abraham azad
    aa      anand agarwal
    aa      ajinke arun
    aa      ajith agarwal
    bb      balu bhaskar
    bb      budde bheema
    bb      banasankari balu 

我想将这些记录加载到hbase中,以便如果要处理 a 键,则应处理所有具有 aa 的键。

最佳答案

我假设您想要表设计的解决方案,而不是代码。

由于Hbase列名对于每一行可以不同,因此可以将aa,bb,cc用作行键,并将每个名称用作列名。

看一看this文章,它解决了以下使用不同表设计的类似问题并进行了比较。

另外,对于将这些数据放入表中的代码,您可以根据情况使用here解释的任何方法。
(我想一个简单的Java代码就能为您做到这一点。)

关于hadoop - 将数据加载到HBase,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32218426/

相关文章:

hadoop - hadoop中多个小文件存放在什么地方最好

hadoop - Hbase 客户端创建数千个到单个服务器的连接

hive - PySpark:java.lang.ClassCastException

mongodb - 限制选择查询批量大小

hadoop - 无法更改HDFS上文件夹的权限。没有打印任何内容作为其原因。

hadoop - 配置单元中的 IndexOutOfBoundsException 索引

java - 是否可以限制 MapReduce 作业访问远程数据?

hadoop - cassandra.input.split.size 未反射(reflect)在 DSE3.2.4 Hadoop 中

hadoop - 在 Amazon EMR 上运行 Pig 字数统计脚本时出现错误

hadoop - 了解 mapreduce.framework.name wrt Hadoop