hadoop - 映射器发出的键值对的数量是否有限制?

标签 hadoop mapreduce

在 Map Reduce 程序中,单个映射器可以发出的键值对数量是否有上限?

我对 Hadoop 1.x 和 2.x 都很感兴趣。我用谷歌搜索了它,但找不到任何答案,也根本找不到任何提及。

谢谢

最佳答案

单个映射器发出的键值对数量没有限制

映射器不断生成写入缓冲区的输出。此缓冲区的大小由配置决定 mapreduce.task.io.sort.mb [默认值:256MB(CDH), 100MB(Source Code)]。
每当此缓冲区占用率达到容量的 mapreduce.map.sort.spill.percent [Def: 0.8] 时,缓冲区内容就会溢出(非阻塞过程)到本地磁盘 - 溢出文件。

关于hadoop - 映射器发出的键值对的数量是否有限制?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40106294/

相关文章:

regex - 如何在Hive中统一时间戳格式

hadoop - hbase表删除后,快照和新克隆的表会发生什么情况

hadoop - 如何在MapReduce作业中输出数据以供Sqoop导出?

hadoop - 如果一个系统的输入依赖于另一个系统的输出,那么在hadoop中会发生什么?

hadoop - MapReduce 计算 SVD(奇异值分解)

hadoop - Hadoop 0.20中的NLinesInputFormat替代方案?

apache-spark - spark-submit --file hdfs://file被缓存在驱动程序的/tmp中

hadoop - 控制 MultipleOutputFormat 文件子路径

hadoop - mapper和reducer类是否需要部署在一个Hadoop集群的所有节点上

hadoop - 在 Hive 中启动 MapReduce 作业的标准