我正在研究满足公司需求的noSQL解决方案。
目前,搜索范围仅限于hBase。我已经阅读了很多有关体系结构,性能等方面的内容,但是对于我来说仍然发现了一件事。
例如,如果您有100个节点集群,并且一行获得100.000个并发请求。在这种情况下,所有100.000个请求将仅命中存储行的一个节点?据我了解,HBase复制仅用于数据备份(不适用于读取负载平衡),并且没有任何主/从机制(如MySQL)?
最佳答案
关于单行的100.000个并发请求-我认为目前没有人对此有好处。在正常情况下,根本不需要这样做-客户端始终与DB隔离,因此在这种情况下(并且可能已缓存)访问受到限制。
关于存储和复制。首先,至少有两种复制类型,实际上不是HBase。 HBase依赖于HDFS,它本质上是容错的。如果您需要了解详细信息,请阅读有关HBase master
和HBase region server
角色的信息,但总体而言,与复制相关的所有内容都归HDFS所有。
关于hadoop - HBase读取高负载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8295605/