我得到了一个具有以下格式的文件,
{"A":1, "B":2, "D":3}
{"C":1, "E":5, "F":3}
{"A":4, "C":5, "F":3}
所以文件的每一行都是一个json对象,它的键可以是ABCDEF中大小为3的任何子集,我现在想要实现的是从文件中解析一个稀疏矩阵,我在每一行中填充 NA,其中该行的 key 不存在。
我使用Python和包json
逐行解析文件,但肯定不是那么整洁和高效,那么对于这个任务有什么建议吗?
最佳答案
我不确定这是否是最有效的,但它确实很简单:
import pandas as pd
json_string = '[{"A":1, "B":2, "D":3},{"C":1, "E":5, "F":3},{"A":4, "C":5, "F":3}]'
df = pd.read_json(json_string)
print(df)
给予:
A B C D E F
0 1.0 2.0 NaN 3.0 NaN NaN
1 NaN NaN 1.0 NaN 5.0 3.0
2 4.0 NaN 5.0 NaN NaN 3.0
关于python - 通过像这样的json文件生成数据矩阵最有效的方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42302999/