Hadoop Pig 作业未运行

标签 hadoop apache-pig jobs

我正在测试 hadoop,截至目前我有:

1) localhost:8088 工作

2) localhost:50070 工作

3) 我在 hdfs 上创建了一些文件

然后我启动 pig,对文件执行 LOAD,然后执行 FILTER,最后执行 DUMP。

当我 DUMP 时,pig 显示有关 mapreduce 开始的信息。

它以这样的句子结尾:

“MapReduceLauncher - 0% 完成”+“正在运行的作业是 [job_xxx]”。

所以我认为工作启动了。我什至在 localhost:8088 的 hadoop 界面上将它视为一个已接受的应用程序。但随后什么也没有发生:它停留在 0% 完成 :-(

因此,作业是“已接受”但永远不会运行 :-(

我应该做些什么来运行我的 grunt/pig 命令行指令吗??

谢谢。

JR.

PS:我不能从我的工作环境中复制粘贴。

最佳答案

当我意识到我的硬盘驱动器已满 90% 时,我解除了封锁。在这个级别,hadoop 拒绝再写日志。我只需要删除一些(大!)文件就可以让它再次运行......

关于Hadoop Pig 作业未运行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28717858/

相关文章:

hadoop + Writable 接口(interface) + readFields 在reducer 中抛出异常

hadoop - 在 Pig 脚本中获取意外符号

hadoop - 通过色调传递 pig 参数(多查询)

node.js - Nodejs 和批处理作业

Java "Printer is not accepting jobs"老兄弟打印机

jenkins - 如何手动删除 Hudson 上的作业

hadoop - Hive 中的分桶未优化

java - Mapreduce 作业因 IO 异常而失败

postgresql - 你如何让驱动程序和执行程序通过 spark-submit 加载和识别 EMR 中的 postgres 驱动程序?

hadoop - apache pig 计数排序