optimization - 有哪些工具可以对Hadoop例程的Cascading进行基准测试?

标签 optimization hadoop benchmarking cascading

我得到了一个多步骤级联程序,该程序所运行的时间大约是等效M / R作业运行时间的十倍。我该如何找出哪些步骤运行最慢,因此可以将其作为优化目标?

最佳答案

我认为这不是一个完整的答案,但足以让您入门。您需要为您的工作生成MapReduce工作流程的图形表示。有关示例,请参见此页面:http://www.cascading.org/multitool/。该图应有助于尝试找出瓶颈所在。

关于optimization - 有哪些工具可以对Hadoop例程的Cascading进行基准测试?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16900798/

相关文章:

C++ 缓存友好方式访问 `vector <struct_type>` 的所有元素的所有成员

hadoop - 如何在Hortonworks Edge Node中安装最新版本的Apache Spark

nosql - NoSQL 上的文件 I/O - 特别是 HBase - 是否推荐?或不?

php - 在单独的行上使用 fseek() fread() 还是 fread() 整个文件和 substr 来解析更好?

mysql - 使用 WHERE 和 GROUP BY 进行查询的最有效索引?

c# - 如何优化此代码以获得更好的可读性?

benchmarking - 使用 pycassa 进行压力测试

hadoop - pagerank如何在mapreduce模型中迭代?

PHP 获取执行特定行的确切时间

php - 从命令行进行快速基准测试