python - Pandas 将重复行复制为唯一行

标签 python pandas

我有一个如下所示的数据框:

df = pd.DataFrame({'Id':['1', '1', '1', '2', '2'], 'Name':['A', 'B', 'C', 'A', 'B']})

我想要的是得到这样的东西。

df1 = pd.DataFrame({'Id':['1', '2'], 'Name':['A', 'B', 'C', 'A', 'B']})

我有一个像上面这样的数据框,但我必须做一些分析,所以我使用以下代码拆分它:

df2 = pd.concat([Series(row['Id'], row['Name'].split(',')) for _, row in df.iterrows()]).reset_index()

我正在寻找反转代码,但我被卡住了。

非常感谢任何帮助!

最佳答案

试试这个:

df.groupby('Id')['Name'].apply(','.join)

您可能需要重置索引并重命名列,但这应该完成主要工作。

关于python - Pandas 将重复行复制为唯一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33107938/

相关文章:

python - Pandas - 查找值是否存在,否则保留相同的值

python - 使用 OpenCV 混合多个图像

python - 跨多个进程训练模型时,在 PyTorch 中使用 tensor.share_memory_() 与 multiprocessing.Queue

python - 如何使用Python让网页实时显示动态数据?

Python pandas 从带有短语的单元格中提取连字符的单词

python - 如何从 Pandas 数据框中满足条件的位置获取前一行

python - 如果条件不匹配,则将数据帧的行与上一行连接

python - TabPy (Tableau) 如何从工作簿自动生成 pdf

python - 将 python 中的两个 pandas 数据框与公共(public)列和字符串条件合并

python - 为什么使用 Pandas.to_datetime 进行的这种日期转换比某些替代方法慢得多?