我正在使用 HappyBase 作为 Python Thrift 客户端来连接到 HBase。
我正在扫描表格,需要在多个列上使用过滤器。如何在 HappyBase 中实现这一点? Java 使用过滤器列表为此提供了一个选项。
最佳答案
如 github 页面上所述,Happybase 使用的是 Thrift。您应该使用与 thrift 相同的语法。
在你的扫描函数中,你可以指定一个过滤字符串:
SingleColumnValueFilter(‘’, ‘, , ‘’)
例如,如果您需要扫描列为 blah:blouh = batman 的所有行:
hbase_table.scan(filter="SingleColumnValueFilter ('blah','blouh',=,'regexstring:^batman$')")
您可以使用 AND 或 OR 来放置多个过滤器,只需记住用括号将所有内容括起来。
Thrift 文档:http://hbase.apache.org/book/thrift.html
在字符串上创建过滤器时要小心,您将必须使用特定的比较器(如我示例中的 regexstring)。
关于python - 在 HappyBase 中使用多列过滤器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18016773/