我正在尝试编写一个代码来搜索 numpy 数组,以查找第五列中的值不包含 50
的情况。如果没有,我希望将其删除。
这是我目前所拥有的:
for rows in range(len(b)):
if b[:,4].any() != 50:
b = np.delete(b, b[rows])
但是,我不断收到以下错误:
too many indices for array
最佳答案
让我们用一些诊断打印来运行计算。请注意错误发生的位置。这很重要! (我们不应该在没有隔离问题的情况下继续尝试!)
In [2]: b=np.array([[0,1,2],[1,2,3],[2,1,2]])
In [3]: for row in range(len(b)):
...: print(row)
...: if b[:,2].any() !=2:
...: print(b[row])
...: b = np.delete(b, b[row])
...:
0
[0 1 2]
1
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-3-04dc188d9a2b> in <module>()
1 for row in range(len(b)):
2 print(row)
----> 3 if b[:,2].any() !=2:
4 print(b[row])
5 b = np.delete(b, b[row])
IndexError: too many indices for array
因此错误发生在第 2 次迭代(行
1)。删除后 b
有问题。 b
的新值是多少?
In [4]: b
Out[4]: array([1, 2, 3, 2, 1, 2])
b
是一维数组,而不是我们开始使用的二维数组。这解释了错误,对吧? delete
的使用一定有问题。也许我们需要检查它的文档????
查看axis
参数:
axis : int, optional
The axis along which to delete the subarray defined by `obj`.
If `axis` is None, `obj` is applied to the flattened array.
我们没有指定轴,所以删除被应用到展平数组,结果展平 - 1d。
但即使我指定了一个轴,我也会得到一个错误(我不会深入),这促使我更仔细地查看 if
条件:
In [10]: b[:,2]
Out[10]: array([2, 3, 2])
In [11]: b[:,2].any()
Out[11]: True
In [12]: b[:,2]!=2
Out[12]: array([False, True, False])
将 any
应用于列没有意义 - 它只是检查列中的任何值是否不为 0。相反,我们想针对目标测试列,获得匹配的 bool 值大小列。
我们可以直接使用那个 bool 值作为行选择掩码
In [13]: b[_,:]
Out[13]: array([[1, 2, 3]])
无需迭代。
您的迭代的另一个问题。您迭代范围 (3),[0,1,2]。但是在循环中,您尝试从 b
中删除一行,从而更改 b
的大小。当您尝试按数字索引 b[row]
时,这会带来问题,对吗?在 Python 或 numpy 中进行迭代时,请小心修改您正在迭代的对象。
很抱歉就此啰嗦,但看起来您需要一些基本的调试指南。
这是一个基本的列表方法:
In [15]: [row for row in b if row[2]!=2]
Out[15]: [array([1, 2, 3])]
我在行上迭代,而不是它们的索引,并为每一行检查列值,如果检查为真,则保留该行。我们可以使用 np.delete
来做到这一点,但列表理解更清晰(也更快)。
关于python - 根据在特定列中找到的值删除行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52841296/