json - pig jsonloader 数组解析问题

标签 json hadoop apache-pig

我下面有一个json编码的数据需要用pig解析。

{"arr":[1,2,3,4]}

根据 http://help.mortardata.com/technologies/pig/json#toc_4JsonLoaderSchemaGuidelines 的文档 , 我的加载模式是:

a = load 'testJsonPig.log' using JsonLoader('arr:{t:(i:int)}');

并转储它:

dump a;

但我得到了意想不到的结果:

()

结果是空的,不知道为什么,好像遇到了和这个链接一样的问题 Pig default JsonLoader schema issue 描述。

我的 pig 版是

Apache Pig version 0.12.1 (r1585011)

并希望有人能帮助我,提前谢谢。

最佳答案

PIG-2949是一个描述这个问题的问题。它已解决并且应该从 Pig 0.15.0 开箱即用。所以是的 - 正如 OP 发现的那样 - elephantbird 是现在处理此类数组的唯一简单方法,但很快 Pig 将能够本地处理它们。

(完全披露 - 我自己关闭了这个问题)

关于json - pig jsonloader 数组解析问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23820641/

相关文章:

hadoop - 如何从 Apache pig 中的日期获取星期几名称?

php - 当数组已包含 JSON 字符串时将数组转换为 JSON 字符串

javascript - PHP JSON 无法回显值,总是返回数组?

hadoop - 连接异常 : Connection refused when run mapreduce in Hadoop

hadoop - S3 和 EMRFS 有什么区别?

windows - 是否可以在 Windows 上安装 Hive 和 Hadoop?

sql - Apache Pig 中是否有等同于多个 COUNT(DISTINCT CASE WHEN ...) 语句的语句?

jsonschema 字符串属性的多个值

ios - 在IOS中解析嵌套的JSON代码

hadoop - 如何在运行 pig 时查看所有 Hadoop 计数器