hadoop:四核机器上映射/减少作业的最佳数量

我试图通过谷歌查找，但没有找到好的引用资料

- I have a Quad-core Ubuntu box running a map-reduce job.  
- running default 2 maps and taking lot of time  
- what be a good number of map/reduce job for a machine of such config?

请多多指教
TIA

最佳答案

似乎是一个经验问题。从 1 开始，然后逐步提高一段时间。绘制一条曲线，看看它的结果如何。我希望您可能会在可用核心数量或可用硬件线程数量(您的机器上可能相同)中找到最佳点。然而，进行实际实验是找出答案的最佳方法。

关于hadoop:四核机器上映射/减少作业的最佳数量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7691962/

上一篇：google-app-engine - 在 Google 应用引擎上部署 Mahout

下一篇：java - hadoop : 1 map multiple reducers with each reducer having different functionality? 可能吗？

java - Hadoop Map-Reduce 。记录阅读器

java - 将时间戳转换为 weekNumber mapReduce

Hadoop 作业失败 : Error Reading IndexFile?

scala - 代码执行的并行化/集群选项

hadoop - Pig Map减少失败并拒绝权限

hadoop - 在 Spark/Python 中前向填充缺失值

hadoop - 我的datanode没有在hadoop 2.7.3多节点中启动

hadoop - 在 pig 中分离元组的元组

hadoop - 如何将一个Hadoop集群中的数据复制到另一个Hadoop集群中？