hadoop - PIG - HBASE - HBaseStorage key 过滤器(gt,lt)

标签 hadoop hbase apache-pig

在 PIG 脚本中,我使用 HBaseStorage 从 HBase 表加载所有行。但是,我想通过行键过滤行。

我查看了源代码,我可以通过构造函数发送 -gt & -lt。但是,我不知道如何将我的值传递给构造函数。它是一个字节[]...

这里是我所在的地方:

LOAD 'hbase://TABLE' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('CF:I','-caster HBaseBinaryConverter') AS (product_id:bytearray);

如果可能,请提供示例代码...

最佳答案

您可以使用带十六进制数字的“\x”来表示二进制值。查看源代码 here .例如,

LOAD 'hbase://TABLE' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('CF:I','-caster HBaseBinaryConverter -lt=\\x01\\x02\\xD4') AS (product_id:bytearray);

关于hadoop - PIG - HBASE - HBaseStorage key 过滤器(gt,lt),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18730784/

相关文章:

linux - 没有管理员权限无法设置hadoop多节点集群

linux - : not a valid identifier bash export says

hadoop - 使用--query参数导入sqoop

mysql - HBase行键设计: matching either of two columns

mysql - 如何增加数据库的读取查询/秒?

hadoop - 带有双引号和逗号的 AWS Glue 问题

windows - windows上Hadoop+HBase集群 : winutils not found

hadoop - Pig 脚本按位置匹配元组条目

hadoop - 如何在以xml为一列的hdfs中查询文件

hadoop - Pig Cassandra process very slow (Heart beat) with oozie