hadoop - Hadoop 集群中的主节点崩溃

我正在使用 10 节点集群，主节点遇到硬件崩溃，导致所有服务包括 ambari 服务器都无法访问。

我无法访问 HDFS，也无法登录到 ambari。

据说当 Master ndoe 宕机时，SNAMEnode 将接管，但在这种情况下，当 master 无法访问时，似乎没有任何服务在运行。整个集群都宕机了，如何进一步挽救集群？或者这表明我必须重新安装所有东西？

最佳答案

当 namenode 关闭时，辅助 namenode 将不再担任 namenode 的角色。辅助名称节点用于执行检查点。引用https://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-hdfs/HdfsUserGuide.html#Secondary_NameNode了解详情。要使名称节点具有高可用性，您需要实现 HA。引用apache website更多细节。

关于hadoop - Hadoop 集群中的主节点崩溃，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29599883/

相关文章：

hadoop - 如何构建大小不适合 RAM 的布隆过滤器？