java - 如何在 Hadoop mapreduce 中处理负载平衡？

标签 java apache hadoop mapreduce distributed

如何在 Hadoop mapreduce 中处理负载平衡？我正在编写一个分布式应用程序，其中服务器根据基准测试、可用内存、CPU 内核数、CPU 使用率、可用 GPU 数/使用情况将作业分配给工作节点？我对 mapreduce 不是很有经验，并且已经阅读了 apache 网站上的一些文档，但我仍然不确定如何着手解决这个问题。我可以进行基准计算并获取所有这些信息，然后通过算法动态拆分输入吗？

谢谢!

最佳答案

“MapReduce 是一种用于处理和生成大型数据集的编程模型和相关实现”摘自 MapReduce 论文摘要。

正如您在评论中所说，您的项目似乎不是数据密集型而是计算密集型，因此我认为 MapReduce 不是您需要使用的工具。

关于java - 如何在 Hadoop mapreduce 中处理负载平衡？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15289226/

上一篇：hadoop - 咕噜模式下的 pig

下一篇：java - Spring + Maven + Hadoop

linux - AH01990 : PRNG still contains insufficient entropy

apache - Let's Encrypt证书: https://www. website.com的问题不适用于重定向到https ://website. com

hadoop - 使用 Spark 时SBT纱的错误

hadoop - 如何以csv2格式从beeline hive下载数据？

hadoop - Hive:如何比较具有复杂数据类型的 WHERE 子句中的两列？

java - 在 javadoc 注释中插入标记代码的 IntelliJ 快捷键是什么？

java - 在 gradle.taskGraph.whenReady 中设置 systemProperty

java - 使用 json 将 Android 连接到 ASP.NET MVC

android - VS 2015 RC Apache Cordova 空白 appTemplate 构建失败