hadoop -/etc/bin/hadoop 是同步调用吗?

标签 hadoop asynchronous mapreduce nutch

当你调用/etc/bin/hadoop jar myjar.jar myclass args 时

map reduce 作业是否同步运行?换句话说,调用是否仅在所有节点上的所有 map reduce 作业完成后才返回?

这在分派(dispatch)了一个 nutch 作业的情况下尤其重要。我想知道在命令返回时站点抓取是否已经完成。

最佳答案

是的,这是一个同步调用,因为对于最终结果,您必须等到所有节点的作业完成。事实上,我想说这也取决于你是如何编写作业的,即你可以添加一些代码行来在终端上打印你当前的抓取状态,通过它你将获得抓取的实时状态更新。 但是要查看抓取的最终输出,您必须等到作业完成。

关于hadoop -/etc/bin/hadoop 是同步调用吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27596653/

相关文章:

Hadoop Datanode 配置核心和 RAM

hadoop - 随机播放错误:超过MAX_FAILED_UNIQUE_FETCHES;救助

c# - 为什么这个异步单元测试会永远阻塞线程?

xml - Hadoop 和结构化数据

java - Spring @async 子线程上下文 Multi-Tenancy

c# - 在 WebClient 异步下载文件时检测连接断开(在 C# 中)

java - Hadoop FileAlreadyExistsException : Output directory hdfs://<namenode public dns>:9000/input already exists

hadoop - hadoop中-libjars的问题

hadoop - mapreduce ---自定义数据类型

Amazon EMR 集群上的 RStudio