我有一个包含 7 个节点、1 个主节点和 6 个核心节点的 hadoop 集群。每台机器上都设置了 Ganglia,Web 前端正确显示了 7 个主机。
但它只显示来自主节点的指标(包括 gmetad 和 gmond)。其他节点和master节点有相同的gmond.conf文件,web前端一目了然。我不明白 Ganglia 如何识别 7 个主机,但只显示带有 gmetad 的盒子中的指标。
如有任何帮助,我们将不胜感激。有没有一种快速的方法来查看这些节点是否正在发送数据?或者这是一个网络问题?
更新#1:当我远程登录到不是主节点的 gmond 主机并查看端口 8649 时,我看到了 XML 但没有数据。当我 telnet 到 master 机器上的 8649 时,我看到了 XML 和数据。关于从这里去哪里的任何建议?
最佳答案
将此设置为您要监控的每个节点的所有 gmond.conf 文件:
send_metadata_interval = 15 // or something.
现在所有节点及其指标都显示在 master (gmetad) 中。
如果您在单播模式下运行,即如果您在 udp_send_channel
而不是 mcast_join
中指定一个 host
,则需要额外的配置>。在多播模式下,gmond
守护进程可以随时互相查询,不需要主动发送监控数据。
关于hadoop - Ganglia 看到节点但看不到指标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33369043/