考虑以下矩阵:
X = np.arange(9).reshape(3,3)
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])
假设我想对以下数组进行子集化
array([[0, 4, 2],
[3, 7, 5]])
可以对行和列进行一些索引,例如
col=[0,1,2]
row = [[0,1],[1,2],[0,1]]
然后,如果我将结果存储在一个变量数组中,我可以使用以下代码来完成:
array=np.zeros([2,3],dtype='int64')
for i in range(3):
array[:,i]=X[row[i],col[i]]
有没有办法广播这种操作?我必须将此作为大文件 ~ 5 Gb 的数据清理阶段,我想使用 dask 来并行化它。但在第一次,如果我能避免使用 for 循环,我会感觉很棒。
最佳答案
对于带有 NumPy's advanced-indexing
的数组, 这将是 -
X[row, np.asarray(col)[:,None]].T
sample 运行-
In [9]: X
Out[9]:
array([[0, 1, 2],
[3, 4, 5],
[6, 7, 8]])
In [10]: col=[0,1,2]
...: row = [[0,1],[1,2],[0,1]]
In [11]: X[row, np.asarray(col)[:,None]].T
Out[11]:
array([[0, 4, 2],
[3, 7, 5]])
关于python - 不对称切片python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49599533/