我有一个如下所示的数据框:
df = pd.DataFrame({'Id':['1', '1', '1', '2', '2'], 'Name':['A', 'B', 'C', 'A', 'B']})
我想要的是得到这样的东西。
df1 = pd.DataFrame({'Id':['1', '2'], 'Name':['A', 'B', 'C', 'A', 'B']})
我有一个像上面这样的数据框,但我必须做一些分析,所以我使用以下代码拆分它:
df2 = pd.concat([Series(row['Id'], row['Name'].split(',')) for _, row in df.iterrows()]).reset_index()
我正在寻找反转代码,但我被卡住了。
非常感谢任何帮助!
最佳答案
试试这个:
df.groupby('Id')['Name'].apply(','.join)
您可能需要重置索引并重命名列,但这应该完成主要工作。
关于python - Pandas 将重复行复制为唯一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33107938/