python - 带有列子集的数据框 drop_duplicates

标签 python pandas dataframe

对于子集参数,我想指定前 n-1 列。我该怎么做呢?

例如:在以下数据集中

   0   1  2   3   4  5   6
0  0  12  1  99  23  2  75
1  0  12  1  99  23  2  66
2  5  12  1  99  23  2  66

我希望结果仅为第一行和第三行:

   0   1  2   3   4  5   6
0  0  12  1  99  23  2  75
1  5  12  1  99  23  2  66

如果我执行以下操作,则会出现错误:

df.drop_duplicates(subset=[0:df.shape[1]-1],keep='first',inplace=True)

最佳答案

您可以使用重复

df[~df.iloc[:,:-1].duplicated()]
Out[53]: 
   0   1  2   3   4  5   6
0  0  12  1  99  23  2  75
2  5  12  1  99  23  2  66

关于python - 带有列子集的数据框 drop_duplicates,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49433555/

相关文章:

python - 如何从循环中获取 tkinter 条目

python - 从 python 嵌套列表在 pandas 中创建新列

python - 为什么元组在保存到 csv 并重新加载数据框(pandas)后会变成字符串?

python - 处理 Pandas 数据框

python - Pandas 列中值之间的平均天数差异

python-3.x - 从冗余二进制数据集创建多标签数据集以进行多标签分类

python - 字符串到日期时间 django

python - 在 Flask 中,如何使用安全 session 通过 curl 对用户进行身份验证?

python - 在一个 NumPy 数组中存储不同的数据类型?

r - 在 SpatialDataFrame 中将两列合并为一列,但在 R 中省略 NA