我有一个包含 3 个节点的 Hbase 集群设置:一个 NameNode 和 2 个 DataNode。 NameNode是一个4GB内存和20GB硬盘的服务器,而每个DataNode有8GB内存和100GB硬盘。
我正在使用 Apache Hadoop 版本:2.7.2 和 Apache Hbase 版本:1.2.4
我看到有人提到了辅助 NameNode。
我的问题是,
- 在我的设置中没有辅助 NameNode 有什么影响?
- 是否可以使用其中一个 DataNode 作为辅助 NameNode?li>
- 如果可能,我该怎么做? (我只在/etc/hadoop/masters 文件中插入了 NameNode。)
最佳答案
- What is the impact of not having a Secondary NameNode in my setup?
SecondaryNamenode
定期将命名空间图像与编辑日志合并(称为检查点)。您的设置不是高可用性设置,因此没有高可用性设置会导致编辑日志变大,最终会在启动期间增加 NameNode 的开销。
- Is it possible to use one of the DataNodes as the Secondary NameNode?
不推荐在 Datanode 主机上运行 SNN。首选单独的主机来运行 Secondary Namenode 进程。为 SNN 选择的主机必须与 NN 具有相同的内存。
- If possible how can I do it? (I inserted only the NameNode in /etc/hadoop/masters file.)
masters
文件不再使用。在 hdfs-site.xml
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>SNN_host:50090</value>
</property>
另请注意,SecondaryNamenode进程默认在执行start-dfs.sh
的节点启动。
关于hadoop - 如何在 HBase 集群设置中添加辅助 NameNode?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43755518/