xml - 将 XML 加载到 PIG : Error 2998

标签 xml hadoop apache-pig

我正在使用 piggybank-0.12.0.jar,pig 版本是 0.12 (CDH)

pig --version

Apache Pig version 0.12.0-cdh5.3.2 (rexported)

我正在尝试使用 piggybank jarXMLLoader 加载 xml 文件。在出现以下错误期间:

REGISTER piggybank-0.12.0.jar;

DEFINE XMLLoader org.apache.pig.piggybank.storage.XMLLoader();

DEFINE RegexExtractAll org.apache.pig.piggybank.evaluation.string.RegexExtractAll();

revisionXML = LOAD 'test3.xml' USING XMLLoader('Rev') AS (revision:chararray);

Error: ERROR org.apache.pig.tools.grunt.Grunt - ERROR 2998: Unhandled internal error. Found interface org.apache.hadoop.mapreduce.JobContext, but class was expected

知道它为什么会出现。

最佳答案

得到上述错误 2998 的解决方案。

要解决它,您可以从源代码构建 piggybank jar。 链接:https://cwiki.apache.org/confluence/display/PIG/PiggyBank

在我的例子中,我使用了带有 CDH 分发的内置 piggybank jar(因为,我没有绕过代理进行在线下载的特权)。它对我来说效果很好。

谢谢,

关于xml - 将 XML 加载到 PIG : Error 2998,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31569987/

相关文章:

hadoop - 在某些情况下,基于 Akka 的应用程序可以替代 Hadoop 设置吗?

sql-server - 从sql server导入数据到hbase

hadoop - 按 Pig Latin 中的最后一列过滤 - 当未指定架构时

java - PIG - 找到接口(interface) org.apache.hadoop.mapreduce.JobContext,但类是预期的

hadoop - 通用连接脚本

java - xml 中的子节点名称

c# - 在编码方面以 XML 序列化特定 C# 类的最简单方法

user-defined-functions - 将数组参数传递给自定义的 Pig 加载器

java - 制作@XmlTransient 注释只是为了序列化?

java - 性能 : Android views generated programmatically vs xml views