我需要按作业执行时间比较两种 Hadoop 调度算法。 我可以使用什么来获取所有任务的执行持续时间?
最佳答案
JobTracker 网络用户界面为您提供非常有用的报告,允许比较每个映射器和缩减器的所有内容和可用日志。
同时查看 hadoop-test.jar
存档中的 mrbench
类。网上有很多关于它在 Hadoop 集群基准测试中的用法的信息,例如 this article .
关于java - 对 Hadoop Map-Reduce 应用程序进行基准测试,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16939831/