hadoop - HBase读取高负载

标签 hadoop nosql hbase hdfs high-availability

我正在研究满足公司需求的noSQL解决方案。
目前，搜索范围仅限于hBase。我已经阅读了很多有关体系结构，性能等方面的内容，但是对于我来说仍然发现了一件事。

例如，如果您有100个节点集群，并且一行获得100.000个并发请求。在这种情况下，所有100.000个请求将仅命中存储行的一个节点？据我了解，HBase复制仅用于数据备份(不适用于读取负载平衡)，并且没有任何主/从机制(如MySQL)？

最佳答案

关于单行的100.000个并发请求-我认为目前没有人对此有好处。在正常情况下，根本不需要这样做-客户端始终与DB隔离，因此在这种情况下(并且可能已缓存)访问受到限制。

关于存储和复制。首先，至少有两种复制类型，实际上不是HBase。 HBase依赖于HDFS，它本质上是容错的。如果您需要了解详细信息，请阅读有关HBase master和HBase region server角色的信息，但总体而言，与复制相关的所有内容都归HDFS所有。

关于hadoop - HBase读取高负载，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8295605/

上一篇：hadoop - 使用hadoop进行mapreduce矩阵乘法

下一篇：python - 无法调用Docker容器

hadoop - 如何使用配置单元获取表a中不在表b中的所有元素？

hadoop - Hadoop OutputCollector重复键

php - 需要一个带有 php 的 DynamoDB 的完整示例

python - 如何通过 Python 访问 Amazon DynamoDB？

hadoop - 用于 Hadoop 作业的 Cassandra 与 HBase

java - 在 HDFS 上使用 libhdfs 进行文件 i/o

hadoop - 没有沙盒的 Apache Kylin 安装

javascript - PouchDb/CouchDb 中的递归删除？

java - 在 map 调用中获取 Spark 上的行