python - Pandas:重复数据删除时如何创建 "master"记录

标签 python pandas dataframe pandas-groupby

下面的 pandas 数据框示例 -

ID  ADDRESS       COLUMN1  COLUMN2  COLUMN3  
1   123 FRONT ST  2017  
1   123 FRONT ST           2016
1   123 FRONT ST                     2018
2   324 2nd st    2008
2   324 2nd st              2014

我的目标是对上面的数据帧进行重复数据删除，但对于“COLUMN1 - COLUMN3”，如果最终结果中该字段不为空，我想保留这些值。几乎正在寻找一种方法来为每个 ID 创建“主”记录(地址和 ID 始终相同)。

目标结果是这样的 -

ID  ADDRESS       COLUMN1  COLUMN2  COLUMN3  
1   123 FRONT ST  2017      2016    2018
2   324 2nd st    2008      2014

最佳答案

df.groupby('ID').first()
Out[156]: 
       ADDRESS  COLUMN1  COLUMN2  COLUMN3
ID                                       
1   123FRONTST   2017.0   2016.0   2018.0
2     3242ndst   2008.0   2014.0      NaN

关于python - Pandas:重复数据删除时如何创建 "master"记录，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47240763/

上一篇：python - 如何替换python中特定单词下的值？

下一篇：python - 从python列表的每个元素中删除文本

相关文章：

python - MysqlDB - 查询被终止

python - 根据数据框中的另一列分配一列

Python - 为 csv/xls 文件生成 avro 模式

python - 如何在 ModelAdmin 中动态操作 Django 中的表单字段？

python - 如何将 mp3 转换为 ogg python

python - 在 Pandas 多索引中选择日期范围的正确方法是什么？

python - 为什么我得到的 Pandas 数据框只有一列而不是系列？

python - 如何将 Pandas 数据框转换为带有列名的 numpy 数组

python - 使用 python mechanize 登录具有 NTLM 身份验证的页面

python - 迭代两个 pandas 数据帧之间的日期范围以获取类别计数