hadoop - Hadoop的基本认识

标签 hadoop

如何在hadoop中设置推测执行? 我们需要在哪些配置文件中进行这些更改?请详细说明。

推测执行更改应该在名称节点还是数据节点中进行?如果在数据节点中,我们可以将它们设置为特定系统,例如(我的集群中有 1-10 个系统,我只为 2,3 个数据节点系统设置推测执行)

最佳答案

推测执行在 Hadoop 中默认开启

要启用/禁用推测执行,请在 mapred-site.xml 中修改这些属性

<property>
   <name>mapreduce.map.speculative</name>
   <value>true</value>
</property>
<property>
   <name>mapreduce.reduce.speculative</name>
   <value>true</value>
</property>

这是一个集群范围的属性,也可以在作业级别设置。

if in Data node can we set them to the particular systems

,可以限制作业运行推测任务而不是节点。

关于hadoop - Hadoop的基本认识,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43310414/

相关文章:

java - 将多个文件添加到 Hadoop 分布式缓存?

java - 为什么hadoop 1.0.3中的reducer非常慢

java - 带有 Java 的 Apache Spark : Launching multiple app requests simultaneously

datetime - Hue 中的 Hive 变量

hadoop - Oozie 每小时协调员对 future 的行动超时

java - 日期和时间戳字段的HIVE和myBatis问题

apache - 我可以仅将源文件中的特定数据加载到HIVE表中吗?

r - 在Hadoop服务器上分配R处理

java - 输入输出同一个目录,MR会不会覆盖记录?

java - web项目中如何使用spark mllib