python - 使用 python 流解析从 org.apache.avro.mapred.AvroAsTextInputFormat 生成的 json 字符串

在使用 python 读取 avro 数据文件的 hadoop 流中，我使用的是输入格式，文档说输入键是 JSON 中的字符串表示。

-inputformat org.apache.avro.mapred.AvroAsTextInputFormat

映射器将其作为行输入获取:

line = "{u'three': u'3', u'two': u'2', u'one': u'1'}"

我如何解析这个字符串，以获得键值对？

最佳答案

我想这就是你需要的:

>>> line = "{u'three': u'3', u'two': u'2', u'one': u'1'}"
>>> line
"{u'three': u'3', u'two': u'2', u'one': u'1'}"
>>> import ast
>>> mydict = ast.literal_eval(line)
>>> mydict
{u'one': u'1', u'three': u'3', u'two': u'2'}
>>> for key in mydict:
    print key, mydict[key]

one 1
three 3
two 2
>>>

关于python - 使用 python 流解析从 org.apache.avro.mapred.AvroAsTextInputFormat 生成的 json 字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25166477/

上一篇：hadoop - 如何在 Spark 上运行 rdd.map 函数后获取 rdd(如何使用 rdd.insertInto)

下一篇：java - 如何在 hadoop 中管理连接 - MultipleInputPath

相关文章：

python - 获取列表部分的相应总和

javascript - Knexnest 查询不返回数组中的数据，即使这是预期的

javascript - json_encode 和 javascript 常量

hadoop - 如果添加到 zookeeper 的 master 之一关闭，则事件 master 不接受新申请

hadoop - MapReduce 中的自定义动态分区

python类关键字参数

python - 列表理解与并发循环python

python - 如何用 Pandas 创建堆叠子图

javascript - Strongloop 追加对象

linux - hdfs 无法通过 hduser、hadoop 安装访问