HBase - Scan.setBatch 如何影响 ResultScanner 的下一个迭代次数?

标签 hbase

假设我有:

  • 具有一个列族 CF 的表。
  • CF 有 10 列 [C1,...,C10]
  • 表有 2 行 ['r1','r2']。每行均已完全填充(每行有 10 个单元格值)。

现在,我创建一个 Scan,它将返回表中两行的所有单元格值。

但我将批处理设置为 scan.setBatch(5)。我使用扫描成功查询表并返回 ResultScanner

现在,当我执行 resultScanner.next() 时,我会得到结果。

我猜我必须调用 next 4 次才能迭代所有单元格。是这样吗?

迭代:

  1. 返回“r1”,“C1”到“C5”的值
  2. 返回“r1”,“C6”到“C10”的值
  3. 返回“r2”,“C1”到“C5”的值
  4. 返回“r2”,“C6”到“C10”的值

这是正确的吗?

我已经知道 api 文档发布在哪里...

最佳答案

是的,没错。主要用于大量列。我希望您知道 getCache 是在行级别。此外,大量列也不是推荐的设计模式。快乐学习

关于HBase - Scan.setBatch 如何影响 ResultScanner 的下一个迭代次数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31707095/

相关文章:

hadoop - 将大量 reducer 输出写入 HBase

.net - 在 .NET 中使用 Thrift 在 Hbase 上进行 MapReduce?

php - 无法启动 Hbase Thrift 服务器

MySQL 和 HBase 连接

hadoop - 如何将表从HBase转移到Hive?

hadoop - 无法通过CM5.5-vmware中的java客户端连接到hbase

hadoop - 使用 pyspark 流式传输到 HBase

hadoop - Hbase错误 "ERROR: KeeperErrorCode = NoNode for/hbase/master"

java - 无法提交并发的Hadoop作业

hadoop - 在 Amazon EMR 上使用来自 java 的 hbase 时遇到问题