concurrency - 当我想同时运行具有1000多个不同参数的相同算法时,Hadoop能做什么?

标签 concurrency hadoop

我想同时运行1000多个不同版本的同一算法(不同的参数),在这种情况下Hadoop是否能够提高性能?
我目前不了解Hadoop,因此这个问题似乎很愚蠢。
我只是想知道Hadoop是否可以为此做些事情,所以我不需要知道如何做。

最佳答案

不,它不能。仅仅是因为它不关心同时运行哪种作业。由于操作系统尝试缓存您的输入,因此您将看到一些性能改进。但是通常框架不会优化这种情况。

Hadoop不是为这类工作而构建的,我非常怀疑您将获得Hadoop良好的性能。

关于concurrency - 当我想同时运行具有1000多个不同参数的相同算法时,Hadoop能做什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13085161/

相关文章:

mysql - 读取未提交并更新

concurrency - 如何将当前线程的绑定(bind)传递给另一个线程?

php - 如何安全地使用 UniqueEntity(在同时有多个用户的网站上)

hadoop - Hive 2.1.0:无法移动源

hadoop - Impala 并发读取和覆盖

concurrency - 如何在 Windows Azure 上使用我的辅助角色中的所有核心?

c - pthread 中的内存访问

hadoop - mapreduce wordcount 程序中的驱动程序未调用 reducer

hadoop - 如何使用 PIG 包含外部 jar 文件

hadoop - 是否可以在特定的从节点上安排 Map Reduce 作业?