java - Hadoop MapReduce 中 Map/Combine 之后和 Reduce 阶段之前的数据保存在哪里？

标签 java hadoop apache-spark mapreduce

在 Spark 中，我们可以随时将数据保存在内存中，但我想知道在 Hadoop MapReduce 的 Map 和 Reduce 阶段之间数据保存在哪里。它是保存在 HDFS、磁盘还是 RAM 中？我的意思是，当数据被洗牌时(即在 Map/Combiner 之后和 Reduce 之前)，它保存在哪里？

最佳答案

根据我在 Hadoop Mapreduce 方面的知识。

1) Map 任务输出写入本地磁盘。(在 Map/Combiner 之后和 Reduce 任务之前)

2) Reducer 任务输出写入 HDFS。

如果Mapreduce作业只有Mapper任务输出写在HDFS中

希望这有帮助!!!...

关于java - Hadoop MapReduce 中 Map/Combine 之后和 Reduce 阶段之前的数据保存在哪里？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40018803/

上一篇：hadoop - hadoop 上的机架感知

下一篇：hadoop - 所有 Hive 函数都失败

mysql - 用于从列中了解流行主题标签的 SQL 查询，该列具有存储为数组的主题标签列表

java - 注销Struts 2.0应用程序后的chrome后退按钮

java - 如何向其中添加 AsyncTask？

java - 在 Gson 中，如何将 JsonArray 添加到 JsonObject？

apache-spark - Spark SVD 不可重现

apache-spark - Spark性能问题与Hive

java - 无法使用 JSF 访问托管 bean 方法

hadoop - 在 HDFS Federation 中，我可以创建一个额外的名称节点作为所有名称节点的备用名称节点的设置吗？

hadoop - Hadoop-Kerberos身份验证