python - 将重复项拆分为单独的表 - Pandas

标签 python pandas dataframe duplicates

在 Pandas 中,我可以使用

基于单个列删除数据库中的重复行
data.drop_duplicates('foo')

命令。我想知道是否有办法在另一个表中捕获此数据以供独立审查。

最佳答案

您可以在 foo 列上调用 duplicated 方法,然后基于它对原始数据框进行子集化,如下所示:

data.loc[data['foo'].duplicated(), :]

举个例子:

data = pd.DataFrame({'foo': [1,1,1,2,2,2], 'bar': [1,1,2,2,3,3]})    
data

# bar foo
#0  1   1
#1  1   1
#2  2   1
#3  2   2
#4  3   2
#5  3   2


data.loc[data['foo'].duplicated(), :]
# bar foo
#1  1   1
#2  2   1
#4  3   2
#5  3   2

关于python - 将重复项拆分为单独的表 - Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38319249/

相关文章:

python - key 错误 : 'cross' when trying to do cartesian product with merge()

python - 未正确调用 DataFrame 构造函数!错误

r - 按连续索引合并 data.frame 行

python - 如何将两个 DataFrame 合并为单个匹配列值

python - python中面板数据的条件logit

python - Pandas :将行从一个数据框添加到另一个数据框?

python - 如何使用 python 将 .csv 文件转换为 .db 文件?

python - 根据 Pandas 中的条件删除行

Python pandas 几种DataFrame最佳实践

python - 如何在索引列上使用正则表达式选择数据框行?