python - 如何使用开始和结束索引对 numpy 行进行切片

标签 python numpy array-broadcasting

index = np.array([[1,2],[2,4],[1,5],[5,6]])
z = np.zeros(shape = [4,10], dtype = np.float32)

设置z[np.arange(4),index[:,0]], z[np.arange(4), index[:, 1]] 它们之间的所有值都为 1?


array([[0, 1, 1, 0, 0, 0, 0, 0, 0, 0],
       [0, 0, 1, 1, 1, 0, 0, 0, 0, 0],
       [0, 1, 1, 1, 1, 1, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 1, 1, 0, 0, 0]])


我们可以利用 NumPy broadcasting对于矢量化解决方案,只需将开始和结束索引与覆盖列长度的范围数组进行比较,即可为我们提供一个掩码,该掩码表示输出数组中需要分配为 1s 的所有位置。


ncols = z.shape[1]
r = np.arange(z.shape[1])
mask = (index[:,0,None] <= r) & (index[:,1,None] >= r)
z[mask] = 1

sample 运行-

In [39]: index = np.array([[1,2],[2,4],[1,5],[5,6]])
    ...: z = np.zeros(shape = [4,10], dtype = np.float32)

In [40]: ncols = z.shape[1]
    ...: r = np.arange(z.shape[1])
    ...: mask = (index[:,0,None] <= r) & (index[:,1,None] >= r)
    ...: z[mask] = 1

In [41]: z
array([[0., 1., 1., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 1., 1., 0., 0., 0., 0., 0.],
       [0., 1., 1., 1., 1., 1., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 1., 1., 0., 0., 0.]], dtype=float32)


z = mask.astype(int)

sample 运行-

In [37]: mask.astype(int)
array([[0, 1, 1, 0, 0, 0, 0, 0, 0, 0],
       [0, 0, 1, 1, 1, 0, 0, 0, 0, 0],
       [0, 1, 1, 1, 1, 1, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 1, 1, 0, 0, 0]])


比较@hpaulj 的foo0 和我的foo4,如@hpaulj 的帖子中所列,用于1000 行和可变列数的集合。我们从 10 列开始,因为这是输入样本的列出方式,我们给它更多的行 - 1000。我们会将列数增加到 1000


In [14]: ncols = 10
    ...: index = np.random.randint(0,ncols,(10000,2))
    ...: z = np.zeros(shape = [len(index),ncols], dtype = np.float32)

In [15]: %timeit foo0(z,index)
    ...: %timeit foo4(z,index)
100 loops, best of 3: 6.27 ms per loop
1000 loops, best of 3: 594 µs per loop

In [16]: ncols = 100
    ...: index = np.random.randint(0,ncols,(10000,2))
    ...: z = np.zeros(shape = [len(index),ncols], dtype = np.float32)

In [17]: %timeit foo0(z,index)
    ...: %timeit foo4(z,index)
100 loops, best of 3: 6.49 ms per loop
100 loops, best of 3: 2.74 ms per loop

In [38]: ncols = 300
    ...: index = np.random.randint(0,ncols,(1000,2))
    ...: z = np.zeros(shape = [len(index),ncols], dtype = np.float32)

In [39]: %timeit foo0(z,index)
    ...: %timeit foo4(z,index)
1000 loops, best of 3: 657 µs per loop
1000 loops, best of 3: 600 µs per loop

In [40]: ncols = 1000
    ...: index = np.random.randint(0,ncols,(1000,2))
    ...: z = np.zeros(shape = [len(index),ncols], dtype = np.float32)

In [41]: %timeit foo0(z,index)
    ...: %timeit foo4(z,index)
1000 loops, best of 3: 673 µs per loop
1000 loops, best of 3: 1.78 ms per loop


关于python - 如何使用开始和结束索引对 numpy 行进行切片,我们在Stack Overflow上找到一个类似的问题:


Python 看不到我的子包

python - 用于句子分类的 Huggingface GPT2 和 T5 模型 API?

python - 在 python 中导入模块的最 pythonic 方法是什么

python - 兼容 Numpy 的图像绘图库

python - 将 numpy 二维数组划分为更精细的分辨率

python - 如何将 1d 数组转换为 3d 数组(将灰度图像转换为 rgb 格式)?

python - 使用 numpy 方法计算核矩阵

python - 使用 == 比较 numpy 数组的规则是什么?

python - 在 GTK+ (linux) 中实现类似 facebook 的模式对话框

python - 使用 Python 估计自相关