python - 通过像这样的json文件生成数据矩阵最有效的方法是什么？

我得到了一个具有以下格式的文件，

{"A":1, "B":2, "D":3}

{"C":1, "E":5, "F":3}

{"A":4, "C":5, "F":3}

所以文件的每一行都是一个json对象，它的键可以是ABCDEF中大小为3的任何子集，我现在想要实现的是从文件中解析一个稀疏矩阵，我在每一行中填充 NA，其中该行的 key 不存在。

我使用Python和包json逐行解析文件，但肯定不是那么整洁和高效，那么对于这个任务有什么建议吗？

最佳答案

我不确定这是否是最有效的，但它确实很简单:

import pandas as pd

json_string = '[{"A":1, "B":2, "D":3},{"C":1, "E":5, "F":3},{"A":4, "C":5, "F":3}]'
df = pd.read_json(json_string)
print(df)

给予:

     A    B    C    D    E    F
0  1.0  2.0  NaN  3.0  NaN  NaN
1  NaN  NaN  1.0  NaN  5.0  3.0
2  4.0  NaN  5.0  NaN  NaN  3.0

关于python - 通过像这样的json文件生成数据矩阵最有效的方法是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42302999/