python - Pandas 到 D3。将数据帧序列化为 JSON

标签 python json d3.js pandas

我有一个包含以下列且没有重复项的 DataFrame:

['region', 'type', 'name', 'value']

可以看成如下层次结构

grouped = df.groupby(['region','type', 'name'])

我想将此层次结构序列化为 JSON 对象。

如果有人感兴趣,这背后的动机是最终将像 this one 这样的可视化放在一起。这需要一个 JSON 文件。

为此,我需要将 grouped 转换为以下内容:

new_data['children'][i]['name'] = region
new_data['children'][i]['children'][j]['name'] = type
new_data['children'][i]['children'][j]'children'][k]['name'] = name
new_data['children'][i]['children'][j]'children'][k]['size'] = value
...

其中regiontypename对应层次结构的不同层级(由i索引,jk)

Pandas/Python 中是否有一种简单的方法可以做到这一点?

最佳答案

沿着这些路线的东西可能会让你到达那里。

from collections import defaultdict

tree = lambda: defaultdict(tree)  # a recursive defaultdict
d = tree()
for _, (region, type, name, value) in df.iterrows():
    d['children'][region]['name'] = region
    ...

json.dumps(d)

向量化的解决方案会更好,也许可以利用 groupby 的速度优势,但我想不出这样的解决方案。

另请查看 df.groupby(...).groups,它返回一个字典。

另见 this answer .

关于python - Pandas 到 D3。将数据帧序列化为 JSON,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23531145/

相关文章:

ios - 先缓冲数据再加载-iOS

javascript - 使用 d3 链接(同步)依赖转换

python - 向 Eclipse 控制台中运行的程序发送 SIGINT (Ctrl-C)

python - pip不会安装mysql-python

Python 正则表达式在>之后使用正向lookbehind进行匹配

json - 我在 Eclipse 中的 .json 文件上收到 "Expected name at XX:YY"错误。怎么了?

javascript - 将 HTML 解析为特定的 JSON 对象

javascript - 向 d3 sunburst 添加标签

javascript - 自定义 d3 线性刻度,为 null 值而不是 0 返回 null

python - 我想找到一个数字中数字的平方和,我的代码对于正数工作正常,但似乎不适用于负数