hadoop - HBase读取高负载

标签 hadoop nosql hbase hdfs high-availability

我正在研究满足公司需求的noSQL解决方案。
目前,搜索范围仅限于hBase。我已经阅读了很多有关体系结构,性能等方面的内容,但是对于我来说仍然发现了一件事。

例如,如果您有100个节点集群,并且一行获得100.000个并发请求。在这种情况下,所有100.000个请求将仅命中存储行的一个节点?据我了解,HBase复制仅用于数据备份(不适用于读取负载平衡),并且没有任何主/从机制(如MySQL)?

最佳答案

关于单行的100.000个并发请求-我认为目前没有人对此有好处。在正常情况下,根本不需要这样做-客户端始终与DB隔离,因此在这种情况下(并且可能已缓存)访问受到限制。

关于存储和复制。首先,至少有两种复制类型,实际上不是HBase。 HBase依赖于HDFS,它本质上是容错的。如果您需要了解详细信息,请阅读有关HBase masterHBase region server角色的信息,但总体而言,与复制相关的所有内容都归HDFS所有。

关于hadoop - HBase读取高负载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8295605/

相关文章:

java - 作者为什么提出HBase Tall-Thin schema over Short-Wide 里面描述的?

hadoop - 如何使用配置单元获取表a中不在表b中的所有元素?

hadoop - Hadoop OutputCollector重复键

php - 需要一个带有 php 的 DynamoDB 的完整示例

python - 如何通过 Python 访问 Amazon DynamoDB?

hadoop - 用于 Hadoop 作业的 Cassandra 与 HBase

java - 在 HDFS 上使用 libhdfs 进行文件 i/o

hadoop - 没有沙盒的 Apache Kylin 安装

javascript - PouchDb/CouchDb 中的递归删除?

java - 在 map 调用中获取 Spark 上的行