在 Pandas 中,我可以使用
基于单个列删除数据库中的重复行data.drop_duplicates('foo')
命令。我想知道是否有办法在另一个表中捕获此数据以供独立审查。
最佳答案
您可以在 foo
列上调用 duplicated
方法,然后基于它对原始数据框进行子集化,如下所示:
data.loc[data['foo'].duplicated(), :]
举个例子:
data = pd.DataFrame({'foo': [1,1,1,2,2,2], 'bar': [1,1,2,2,3,3]})
data
# bar foo
#0 1 1
#1 1 1
#2 2 1
#3 2 2
#4 3 2
#5 3 2
data.loc[data['foo'].duplicated(), :]
# bar foo
#1 1 1
#2 2 1
#4 3 2
#5 3 2
关于python - 将重复项拆分为单独的表 - Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38319249/