python - 根据在特定列中找到的值删除行

标签 python python-3.x numpy

我正在尝试编写一个代码来搜索 numpy 数组,以查找第五列中的值不包含 50 的情况。如果没有,我希望将其删除。

这是我目前所拥有的:

for rows in range(len(b)):
    if b[:,4].any() != 50:
        b = np.delete(b, b[rows])

但是,我不断收到以下错误:

too many indices for array

最佳答案

让我们用一些诊断打印来运行计算。请注意错误发生的位置。这很重要! (我们不应该在没有隔离问题的情况下继续尝试!)

In [2]: b=np.array([[0,1,2],[1,2,3],[2,1,2]])
In [3]: for row in range(len(b)):
   ...:     print(row)
   ...:     if b[:,2].any() !=2:
   ...:         print(b[row])
   ...:         b = np.delete(b, b[row])
   ...:         
0
[0 1 2]
1
---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
<ipython-input-3-04dc188d9a2b> in <module>()
      1 for row in range(len(b)):
      2     print(row)
----> 3     if b[:,2].any() !=2:
      4         print(b[row])
      5         b = np.delete(b, b[row])
IndexError: too many indices for array

因此错误发生在第 2 次迭代( 1)。删除后 b 有问题。 b 的新值是多少?

In [4]: b
Out[4]: array([1, 2, 3, 2, 1, 2])

b 是一维数组,而不是我们开始使用的二维数组。这解释了错误,对吧? delete 的使用一定有问题。也许我们需要检查它的文档????

查看axis参数:

axis : int, optional
  The axis along which to delete the subarray defined by `obj`.
  If `axis` is None, `obj` is applied to the flattened array.

我们没有指定轴,所以删除被应用到展平数组,结果展平 - 1d。

但即使我指定了一个轴,我也会得到一个错误(我不会深入),这促使我更仔细地查看 if 条件:

In [10]: b[:,2]
Out[10]: array([2, 3, 2])
In [11]: b[:,2].any()
Out[11]: True
In [12]: b[:,2]!=2
Out[12]: array([False,  True, False])

any 应用于列没有意义 - 它只是检查列中的任何值是否不为 0。相反,我们想针对目标测试列,获得匹配的 bool 值大小列。

我们可以直接使用那个 bool 值作为行选择掩码

In [13]: b[_,:]
Out[13]: array([[1, 2, 3]])

无需迭代。

您的迭代的另一个问题。您迭代范围 (3),[0,1,2]。但是在循环中,您尝试从 b 中删除一行,从而更改 b 的大小。当您尝试按数字索引 b[row] 时,这会带来问题,对吗?在 Python 或 numpy 中进行迭代时,请小心修改您正在迭代的对象。

很抱歉就此啰嗦,但看起来您需要一些基本的调试指南。


这是一个基本的列表方法:

In [15]: [row for row in b if row[2]!=2]
Out[15]: [array([1, 2, 3])]

我在行上迭代,而不是它们的索引,并为每一行检查列值,如果检查为真,则保留该行。我们可以使用 np.delete 来做到这一点,但列表理解更清晰(也更快)。

关于python - 根据在特定列中找到的值删除行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52841296/

相关文章:

python - scipy curve_fit 错误 : divide by zero encountered

python - Django 评论垃圾邮件过滤器

Python 无法使用 Selenium 识别表格单元格中的文本

python - Pandas rolling_quantile 错误?

python - 如何使用 "rolling(window)"找到每批最频繁的值?

python - 将 numpy.ndarray 值从字节转换为 float

python - itertools.product 消除重复的反转元组

python - 语法错误 : unexpected EOF while parsing

python - python中有序集合的交集

python - tensorflow : ValueError: Shape must be rank 2 but is rank 3