python - 使用 NumPy 从另一个数组及其索引创建一个二维数组

标签 python arrays numpy

给定一个数组:

arr = np.array([[1, 3, 7], [4, 9, 8]]); arr

array([[1, 3, 7],
       [4, 9, 8]])

并给出它的索引:

np.indices(arr.shape)

array([[[0, 0, 0],
        [1, 1, 1]],

       [[0, 1, 2],
        [0, 1, 2]]])

我怎样才能将它们整齐地堆叠在一起形成一个新的二维阵列?这就是我想要的:

array([[0, 0, 1],
       [0, 1, 3],
       [0, 2, 7],
       [1, 0, 4],
       [1, 1, 9],
       [1, 2, 8]])

这是我目前的解决方案:

def foo(arr):
    return np.hstack((np.indices(arr.shape).reshape(2, arr.size).T, arr.reshape(-1, 1)))

它有效,但是是否有更短/更优雅的方法来执行此操作?

最佳答案

使用 array-initialization 然后使用 broadcasted-assignment 在后续步骤中分配索引和数组值 -

def indices_merged_arr(arr):
    m,n = arr.shape
    I,J = np.ogrid[:m,:n]
    out = np.empty((m,n,3), dtype=arr.dtype)
    out[...,0] = I
    out[...,1] = J
    out[...,2] = arr
    out.shape = (-1,3)
    return out

请注意,我们正在避免使用 np.indices(arr.shape),这可能会减慢速度。

sample 运行-

In [10]: arr = np.array([[1, 3, 7], [4, 9, 8]])

In [11]: indices_merged_arr(arr)
Out[11]: 
array([[0, 0, 1],
       [0, 1, 3],
       [0, 2, 7],
       [1, 0, 4],
       [1, 1, 9],
       [1, 2, 8]])

性能

arr = np.random.randn(100000, 2)

%timeit df = pd.DataFrame(np.hstack((np.indices(arr.shape).reshape(2, arr.size).T,\
                                arr.reshape(-1, 1))), columns=['x', 'y', 'value'])
100 loops, best of 3: 4.97 ms per loop

%timeit pd.DataFrame(indices_merged_arr_divakar(arr), columns=['x', 'y', 'value'])
100 loops, best of 3: 3.82 ms per loop

%timeit pd.DataFrame(indices_merged_arr_eric(arr), columns=['x', 'y', 'value'], dtype=np.float32)
100 loops, best of 3: 5.59 ms per loop

注意:时间包括转换为 pandas 数据帧,这是此解决方案的最终用例。

关于python - 使用 NumPy 从另一个数组及其索引创建一个二维数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45857465/

相关文章:

c - 处理 fscanf()

python - 在将点添加到节点之前是否预先制作了二进制分区树?

python - 如何使用多处理来加速以下功能?

python - 如何控制 tensorflow 中的维度广播?

python - request.urlretrieve 在 PythonAnywhere 中作为计划任务运行时失败

Python LXML 安装问题

python - Django Rest框架从Serializer继承一个类并使其抽象

php - 通过 ajax POST json 数据发送一个空数组

c++ - 循环正确填充数组然后函数返回所有相同数字的数组?

python - 如何在曲面图上绘制等高线? (4D)