我们正在构建一个产品,它可以在大数据上运行多个并行作业。关于一个好的 java 库的任何建议,它可以帮助我们测量/封装每个作业和聚合统计信息——比如时间/内存/资源使用情况?
此外,任何与 hadoop/hbase/yarn 等框架良好集成以捕获与特定作业相关的框架特定统计信息的优秀 Java 库?
最佳答案
您可以使用 Cloudera 管理界面:
关于java - 用于捕获工作统计信息的任何好的 java 库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20948742/