hadoop - 我应该使用哪个版本的 Hadoop?

标签 hadoop

Hadoop目前有三个分支:0.2x、1.x和2.x。支持使用其中一种而不是另一种的论据是什么?

最佳答案

Hadoop 最近更改了其 Map/Reduce 实现(现在称为 Yarn)。这可能是选择相对较新版本的原因之一。

如果您想将 Hadoop 与其他相关项目(例如 HBase)结合使用,版本向量就不是那么简单了。

您可能想查看 Cloudera 的产品(我不隶属于 Cloudera)。他们提供了一些发行版,您可以从中选择适合彼此的工具子集。当然,他们还提供专业的服务。

关于hadoop - 我应该使用哪个版本的 Hadoop?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12596116/

相关文章:

hadoop - 可以在 hive 中看到数据库和空表,但在 WEB UI 文件系统上看不到

hadoop - pig 有不止一种情况。

java - 在 Hadoop 上运行 Spark

java - SequenceFile 到 .txt 转换

python - 如何使用 hbase 作为 hadoop 流作业的源

hadoop - hive 查询CSV文本分隔符问题

java - Ignite 上的 Spark 是否使用 Ignite 的 Job Stealing(如果已设置)?

hadoop - YARN "Fair Scheduler"如何使用spark-submit配置参数

sql - Hive 加入理解问题

java - reducer 数量对集群节点数量的依赖性