hadoop - Hadoop的基本认识

如何在hadoop中设置推测执行？我们需要在哪些配置文件中进行这些更改？请详细说明。

推测执行更改应该在名称节点还是数据节点中进行？如果在数据节点中，我们可以将它们设置为特定系统，例如(我的集群中有 1-10 个系统，我只为 2,3 个数据节点系统设置推测执行)

最佳答案

推测执行在 Hadoop 中默认开启。

要启用/禁用推测执行，请在 mapred-site.xml 中修改这些属性

<property>
   <name>mapreduce.map.speculative</name>
   <value>true</value>
</property>
<property>
   <name>mapreduce.reduce.speculative</name>
   <value>true</value>
</property>

这是一个集群范围的属性，也可以在作业级别设置。

if in Data node can we set them to the particular systems

不，可以限制作业运行推测任务而不是节点。

关于hadoop - Hadoop的基本认识，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43310414/

上一篇：java - 使用cloudera hadoop java培训项目时加载类失败

下一篇：hadoop - 使用 Spark 获取存储在 JSON 中的值列表的统计属性

相关文章：

java - 将多个文件添加到 Hadoop 分布式缓存？

java - 为什么hadoop 1.0.3中的reducer非常慢

java - 带有 Java 的 Apache Spark : Launching multiple app requests simultaneously

datetime - Hue 中的 Hive 变量

hadoop - Oozie 每小时协调员对 future 的行动超时

java - 日期和时间戳字段的HIVE和myBatis问题

apache - 我可以仅将源文件中的特定数据加载到HIVE表中吗？

r - 在Hadoop服务器上分配R处理

java - 输入输出同一个目录，MR会不会覆盖记录？

java - web项目中如何使用spark mllib