下面的 pandas 数据框示例 -
ID ADDRESS COLUMN1 COLUMN2 COLUMN3
1 123 FRONT ST 2017
1 123 FRONT ST 2016
1 123 FRONT ST 2018
2 324 2nd st 2008
2 324 2nd st 2014
我的目标是对上面的数据帧进行重复数据删除,但对于“COLUMN1 - COLUMN3”,如果最终结果中该字段不为空,我想保留这些值。几乎正在寻找一种方法来为每个 ID 创建“主”记录(地址和 ID 始终相同)。
目标结果是这样的 -
ID ADDRESS COLUMN1 COLUMN2 COLUMN3
1 123 FRONT ST 2017 2016 2018
2 324 2nd st 2008 2014
最佳答案
df.groupby('ID').first()
Out[156]:
ADDRESS COLUMN1 COLUMN2 COLUMN3
ID
1 123FRONTST 2017.0 2016.0 2018.0
2 3242ndst 2008.0 2014.0 NaN
关于python - Pandas:重复数据删除时如何创建 "master"记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47240763/