python - 将重复项拆分为单独的表 - Pandas

在 Pandas 中，我可以使用

基于单个列删除数据库中的重复行

data.drop_duplicates('foo')

命令。我想知道是否有办法在另一个表中捕获此数据以供独立审查。

最佳答案

您可以在 foo 列上调用 duplicated 方法，然后基于它对原始数据框进行子集化，如下所示:

data.loc[data['foo'].duplicated(), :]

举个例子:

data = pd.DataFrame({'foo': [1,1,1,2,2,2], 'bar': [1,1,2,2,3,3]})    
data

# bar foo
#0  1   1
#1  1   1
#2  2   1
#3  2   2
#4  3   2
#5  3   2


data.loc[data['foo'].duplicated(), :]
# bar foo
#1  1   1
#2  2   1
#4  3   2
#5  3   2

关于python - 将重复项拆分为单独的表 - Pandas，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38319249/

上一篇：python - Django channel websocket.receive 未处理

下一篇：Python Selenium - FireFox 网络驱动程序配置文件首选项中可能的键是什么

python - 未正确调用 DataFrame 构造函数!错误

r - 按连续索引合并 data.frame 行

python - 如何将两个 DataFrame 合并为单个匹配列值

python - python中面板数据的条件logit

python - Pandas :将行从一个数据框添加到另一个数据框？

python - 如何使用 python 将 .csv 文件转换为 .db 文件？

python - 根据 Pandas 中的条件删除行

Python pandas 几种DataFrame最佳实践

python - 如何在索引列上使用正则表达式选择数据框行？