这可能是重复的,但我找不到所需的答案。 那么,问题来了:
假设,我有这样一个数据框:
d1 = {'col1': [[1],[2,3]],
'col2' : [[3],[21,1]]}
df1 = pd.DataFrame(d1)
现在,我们可以通过 df1.apply(pd.Series.explode)
非常轻松地垂直扩展此数据框。
但是,在水平方向扩展并更改列名的最优雅方式是什么?
像这样:
d2 = {
'col1_1':[1,2],
'col1_2': [np.NAN,3],
'col2_1' : [3,21],
'col2_2' : [np.NAN,1]
}
df2 = pd.DataFrame(d2)
输出:
最佳答案
x = pd.concat(
[df1[c].apply(pd.Series).add_prefix(c + "_") for c in df1], axis=1
)
print(x)
打印:
col1_0 col1_1 col2_0 col2_1
0 1.0 NaN 3.0 NaN
1 2.0 3.0 21.0 1.0
如果你想要基于 1 的索引列:
x = pd.concat(
[df1[c].apply(pd.Series).add_prefix(c + "_") for c in df1], axis=1
).rename(
columns=lambda x: "{}_{}".format(x.split("_")[0], int(x.split("_")[1]) + 1)
)
print(x)
打印:
col1_1 col1_2 col2_1 col2_2
0 1.0 NaN 3.0 NaN
1 2.0 3.0 21.0 1.0
关于python - Pandas :水平扩展/分解数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67442107/