python - 如何展平 pandas 数据框多列中的字典列表

标签 python pandas dataframe dictionary flatten

我有一个数据框,每条记录都存储一个字典列表,如下所示:

row prodect_id recommend_info
  0 XQ002      [{"recommend_key":"XXX567","recommend_point":50},
                {"recommend_key":"XXX236","recommend_point":20},
                {"recommend_key":"XXX090","recommend_point":35}]
  1 XQ003      [{"recommend_key":"XXX089","recommend_point":30},
                {"recommend_key":"XXX567","recommend_point":20}]

我想展平字典列表,使其看起来像这样

row prodect_id recommend_info_recommend_key recommend_info_recommend_point
  0 XQ002      XXX567                       50
  1 XQ002      XXX236                       20
  2 XQ002      XXX090                       35
  3 XQ003      XXX089                       30
  4 XQ003      XXX567                       20

我知道如何仅将一个字典列表转换为数据框。 像这样:

d = [{"recommend_key":"XXX089","recommend_point":30},
     {"recommend_key":"XXX567","recommend_point":20}]

df = pd.DataFrame(d)

row recommend_key recommend_point
  0 XXX089        30
  1 XXX567        20

但是当有一列存储字典列表,或者有多列存储字典列表时,我不知道如何对数据框执行此操作

row  col_a  col_b                  col_c
  0  B001   [{"a":"b"},{"a":"c"}]  [{"y":11},{"a":"c"}]
  1  D009   [{"c":"o"},{"g":"c"}]  [{"y":11},{"a":"c"},{"l":"c"}]   
  2  G068   [{"c":"b"},{"a":"c"}]  [{"a":56},{"d":"c"}]
  3  C004   [{"d":"a"},{"b":"c"}]  [{"c":22},{"a":"c"},{"b":"c"}]
  4  F011   [{"h":"u"},{"d":"c"}]  [{"h":27},{"d":"c"}]

最佳答案

尝试:

pd.concat([df.explode('recommend_info').drop(['recommend_info'], axis=1),
           df.explode('recommend_info')['recommend_info'].apply(pd.Series)],
          axis=1)

您可以对每一列重复执行相同的操作

这是一个例子:

>>> df = pd.DataFrame({'a': [[{3: 4, 5: 6}, {3:8, 5: 1}],
...                          [{3:2, 5:4}, {3: 8, 5: 10}]],
...                    'b': ['X', "Y"]})
>>> df
                               a  b
0   [{3: 4, 5: 6}, {3: 8, 5: 1}]  X
1  [{3: 2, 5: 4}, {3: 8, 5: 10}]  Y
>>> df = pd.concat([df.explode('a').drop(['a'], axis=1),
...                 df.explode('a')['a'].apply(pd.Series)],
...                axis=1)
>>> df
   b  3   5
0  X  4   6
0  X  8   1
1  Y  2   4
1  Y  8  10

关于python - 如何展平 pandas 数据框多列中的字典列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67790590/

相关文章:

python - 使用 pandas 绘图时,图例仅显示一个标签

python - 针对 Python 使用的适当 Unix(.profile、.bash_profile)更改

python - 如何在 Keras 的一个模型中两次使用相同的层/模型?

python - for循环并在Python中添加额外的列groupby pandas dataframe

通过创建新行替换数据框中一行的值,但保留修改后的原始行

python - 检索当前行和上一个/下一个正值之间的行数

python - 合并 2 个 pandas 数据框时的重复

python - 尝试在某些 GIMP Python 插件代码上运行 Sphinx 时出错

python - 如何模拟我无法访问的对象属性?

python - 如何连接 Pandas 数据框列