根据我目前阅读的内容,HBase 需要安装 Hadoop。看起来 HBase 可以设置为使用现有的 Hadoop 集群(与其他一些用户共享)还是可以设置为使用专用的 Hadoop 集群?我想后者会是一个更安全的配置,但我想知道是否有人对前者有任何经验(但我不太确定我对 HBase 设置的理解是否正确)。
最佳答案
我知道 Facebook 和其他大型组织出于性能原因将其 HBase 集群(实时访问)与其 Hadoop 集群(批处理分析)分开。集群上的大型 MapReduce 作业有能力影响实时接口(interface)的性能,这可能会产生问题。
在较小的组织或 HBase 响应时间不一定需要保持一致的情况下,您可以只使用相同的集群。
除了性能问题之外,没有太多(或任何)关于共存的问题。
关于hadoop - HBase 和 Hadoop,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9935863/