我正在使用 10 节点集群,主节点遇到硬件崩溃,导致所有服务包括 ambari 服务器都无法访问。
我无法访问 HDFS,也无法登录到 ambari。
据说当 Master ndoe 宕机时,SNAMEnode 将接管,但在这种情况下,当 master 无法访问时,似乎没有任何服务在运行。整个集群都宕机了,如何进一步挽救集群?或者这表明我必须重新安装所有东西?
最佳答案
当 namenode 关闭时,辅助 namenode 将不再担任 namenode 的角色。辅助名称节点用于执行检查点。引用https://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-hdfs/HdfsUserGuide.html#Secondary_NameNode了解详情。要使名称节点具有高可用性,您需要实现 HA。引用apache website更多细节。
关于hadoop - Hadoop 集群中的主节点崩溃,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29599883/