我在 Hadoop 集群中收集了我的作业统计信息。我获取了 JobHistory 日志并使用 Rumen 处理它们。在 json 文件中,对于每个任务尝试,都有一个名为“cpuUsages”的字段。
例子:
"cpuUsages" : [ 6028, 3967, 3597, 3354, 3225, 3454, 3589, 4316, 42632, 102, 103, 103 ]
我需要知道这些数字的计量单位。一些官方或学术引用资料?
最佳答案
Rumen从 MR 作业历史服务器中提取指标。因此指标与 MR 作业历史服务器中的指标相同。
可以看到here MR 作业历史服务器提供 MILLI SECONDS 内的 CPU 使用率。所以测量单位可以是 Wall CPU 使用时间,单位为毫秒。
关于json - 使用 Rumen 处理的 JobHistory 日志中的 Cpu 指标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40898045/