python - 以 PEP8 方式检查 pandas 重复项

标签 python pandas pycharm pep8

我能想到的检查 pandas 数据框中重复项的最简单方法如下:

if (df["col1"].value_counts() > 1).sum() > 0:
    raise ValueError("dupes in column 'col1'!")

问题是这不符合 PEP8 标准。我的 IDE(我使用 PyCharm)中的代码检查器告诉我:

Unresolved attribute reference 'sum' for class 'bool'

在不添加多行代码的情况下检查 pandas 重复项的可接受方法是什么?

最佳答案

您的错误与 PEP8 无关。事实上,您的错误似乎是误报:您的 IDE 似乎猜测比较操作的结果是 bool 值,因此没有 sum任何方法。

但是您的语法没有任何问题:df["col1"].value_counts() > 1 返回一个 bool 型 pd.Series 对象,它确实有 sumany 方法。

我可以建议的唯一解决方案是使用另一个 IDE。或者禁用您的代码检查器。

关于python - 以 PEP8 方式检查 pandas 重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50710099/

相关文章:

python - python中的多行列表理解

python - 在 Pandas GroupBy 数据框中按 ID 计算两个日期之间的行数

python - Python创建列表列表时出现"NoneType"属性错误

python-2.7 - 我应该如何检查超过 10 列的 nan 值并选择那些具有 nan 值的行,即 keepna() 而不是 dropna()

pycharm - 在pycharm中,如何跳转到下一个严重错误? (F2查找样式警告)

python - 禁用 Pycharm 打印自动完成

ubuntu - Ubuntu 20.04 中 PyCharm 出现 "File not found"错误

Python崩溃没有错误

python - 在多个管道上选择

python - matplotlib 中的最后一个图形标记未完全显示