hadoop:四核机器上映射/减少作业的最佳数量

标签 hadoop mapreduce

我试图通过谷歌查找,但没有找到好的引用资料

- I have a Quad-core Ubuntu box running a map-reduce job.  
- running default 2 maps and taking lot of time  
- what be a good number of map/reduce job for a machine of such config?  

请多多指教
TIA

最佳答案

似乎是一个经验问题。从 1 开始,然后逐步提高一段时间。绘制一条曲线,看看它的结果如何。我希望您可能会在可用核心数量或可用硬件线程数量(您的机器上可能相同)中找到最佳点。然而,进行实际实验是找出答案的最佳方法。

关于hadoop:四核机器上映射/减少作业的最佳数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7691962/

相关文章:

java - 在 AWS EMR 上运行 Java 1.8 时不支持 major.minor 版本 52.0

java - Hadoop Map-Reduce 。记录阅读器

java - 将时间戳转换为 weekNumber mapReduce

Hadoop 作业失败 : Error Reading IndexFile?

scala - 代码执行的并行化/集群选项

hadoop - Pig Map减少失败并拒绝权限

hadoop - 在 Spark/Python 中前向填充缺失值

hadoop - 我的datanode没有在hadoop 2.7.3多节点中启动

hadoop - 在 pig 中分离元组的元组

hadoop - 如何将一个Hadoop集群中的数据复制到另一个Hadoop集群中?