python - 使用 python pandas 将具有多行的 python 数据框转换为一行?

标签 python pandas dataframe apply

具有以下数据框,

df = pd.DataFrame({'device_id' : ['0','0','1','1','2','2'],
               'p_food'    : [0.2,0.1,0.3,0.5,0.1,0.7],
               'p_phone'   : [0.8,0.9,0.7,0.5,0.9,0.3]
              })
print(df)

输出:

  device_id  p_food  p_phone
0         0     0.2      0.8
1         0     0.1      0.9
2         1     0.3      0.7
3         1     0.5      0.5
4         2     0.1      0.9
5         2     0.7      0.3

如何实现这种转变?

df2 = pd.DataFrame({'device_id' : ['0','1','2'],
                   'p_food_1'    : [0.2,0.3,0.1],
                   'p_food_2'    : [0.1,0.5,0.7],
                   'p_phone_1'   : [0.8,0.7,0.9],                    
                   'p_phone_2'   : [0.9,0.5,0.3]
                  })
print(df2)

输出:

  device_id  p_food_1  p_food_2  p_phone_1  p_phone_2
0         0       0.2       0.1        0.8        0.9
1         1       0.3       0.5        0.7        0.5
2         2       0.1       0.7        0.9        0.3

我尝试使用 groupby、apply、agg...
但是我仍然无法实现这种转变。

更新
我的最终代码:

df.drop_duplicates('device_id', keep='first').merge(df.drop_duplicates('device_id', keep='last'),on='device_id')

感谢 su79eu7kA-Za-z 付出的时间和精力。
言语不足以表达我的感激之情。

最佳答案

如果您仍在使用 groupby 寻找答案

df = df.groupby('device_id')['p_food', 'p_phone'].apply(lambda x: pd.DataFrame(x.values)).unstack().reset_index()
df.columns = df.columns.droplevel()
df.columns = ['device_id','p_food_1', 'p_food_2', 'p_phone_1','p_phone_2']

你得到

    device_id   p_food_1    p_food_2    p_phone_1   p_phone_2
0   0           0.2         0.1         0.8         0.9
1   1           0.3         0.5         0.7         0.5
2   2           0.1         0.7         0.9         0.3

关于python - 使用 python pandas 将具有多行的 python 数据框转换为一行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43729268/

相关文章:

python - Numpy python 中的数组索引

python - 避免使用多个 if 语句

python - 计算数据框中多个组的 z 分数

python - 在 pandas 中执行条件 groupby 计数后显示列的零值

python - 如果索引是时间戳,如何从 pandas 生成列表

python - 如何使用 pandas 或其他方式在 python 中拆分 CSV 文件中的值?

python - 在 Python 中展平可变深度的列表

python 列表比较和替换

python - 如何将列表字典转换为 Pandas 中的数据框

python - 在 Pandas DataFrames 中找到最近点