mongodb - Hbase 数据应该如何才能快速查询响应？

我的情况符合以下规则:

数据将使用 Kafka 和 spark-streaming 解析到 HBase。

我想使用 HBase，TTL 为 3 小时，版本控制为 1，满足上述条件。问题是我很困惑如何在 HBase 中组织数据以获得更快的查询响应，我应该使用具有 field 名称或 field 名称的单个列作为不同的列名称吗？

哪个更好，为什么？

需要执行的查询是: 1.用户A现在在哪里？ 2. 现在 X 地点有哪些用户？

最佳答案

最高效的查询是基于HBase表的row key。我会使用用户名作为行键，以便能够快速获取特定用户所在位置的信息。每行都需要一列 - 地点。

显然，要收集所有数据(查询 2:地点 X 有哪些用户)，您需要扫描整个(部分)表格。所以效率不会很高。查看 HBase 的二级索引 - 如果您遇到此类查询的性能问题。

关于mongodb - Hbase 数据应该如何才能快速查询响应？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44479855/

相关文章：

java - Spring boot注入(inject)mongodb数据源