我能想到的检查 pandas 数据框中重复项的最简单方法如下:
if (df["col1"].value_counts() > 1).sum() > 0:
raise ValueError("dupes in column 'col1'!")
问题是这不符合 PEP8 标准。我的 IDE(我使用 PyCharm)中的代码检查器告诉我:
Unresolved attribute reference 'sum' for class 'bool'
在不添加多行代码的情况下检查 pandas 重复项的可接受方法是什么?
最佳答案
您的错误与 PEP8 无关。事实上,您的错误似乎是误报:您的 IDE 似乎猜测比较操作的结果是 bool 值,因此没有 sum
或 任何
方法。
但是您的语法没有任何问题:df["col1"].value_counts() > 1
返回一个 bool 型 pd.Series
对象,它确实有 sum
和 any
方法。
我可以建议的唯一解决方案是使用另一个 IDE。或者禁用您的代码检查器。
关于python - 以 PEP8 方式检查 pandas 重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50710099/