python - 查找两个 numpy 数组之间的索引映射

标签 python numpy mapping where-clause

numpy 中有没有一种很好的方法来获取 array1 中每个元素在 array2 中的逐元素索引?

一个例子:

array1 = np.array([1, 3, 4])
array2 = np.arange(-2, 5, 1, dtype=np.int)

np.where(array1[0] == array2)
# (array([3]),)
np.where(array1[1] == array2)
# (array([5]),)
np.where(array1[2] == array2)
# (array([6]),)

我想做

np.where(array1 == array2)
# (array([3 5 6]),)

这样的事情可能吗?我们保证 array1 中的所有条目都可以在 array2 中找到。

最佳答案

方法#1:使用 np.in1d在那里获取匹配发生位置的掩码,然后使用 np.where 获取这些索引位置 -

np.where(np.in1d(array2, array1))

方法#2:使用 np.searchsorted -

np.searchsorted(array2, array1)

请注意,如果array2未排序,我们需要使用附加的可选参数sorter

示例运行 -

In [14]: array1
Out[14]: array([1, 3, 4])

In [15]: array2
Out[15]: array([-2, -1,  0,  1,  2,  3,  4])

In [16]: np.where(np.in1d(array2, array1))
Out[16]: (array([3, 5, 6]),)

In [17]: np.searchsorted(array2, array1)
Out[17]: array([3, 5, 6])

运行时测试 -

In [62]: array1 = np.random.choice(10000,1000,replace=0)

In [63]: array2 = np.sort(np.random.choice(100000,10000,replace=0))

In [64]: %timeit np.where(np.in1d(array2, array1))
1000 loops, best of 3: 483 µs per loop

In [65]: %timeit np.searchsorted(array2, array1)
10000 loops, best of 3: 40 µs per loop

关于python - 查找两个 numpy 数组之间的索引映射,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42373654/

相关文章:

python - 如何从 sklearn GridSearchCV 中获取 MSE 和 R2?

python - 迭代字典,每次迭代从第一个键值开始

python - 如何在 Python 中解析 RSS feed 中的 HTML 标签

numpy - 如何通过固定索引将 4D numpy 数组转换为 2D

python - 如何将多个数据库文件与 numpy 结合起来?

java - 有没有办法使用elasticsearch java api加载包含索引映射的json文件?

c# - Automapper:数组到对象的映射

python - Boto3 AWS S3 存储桶创建错误

mapping - Entity Framework 代码优先 - 多对多外键问题

numpy - 沿 Numpy ndarray 轴的最大值?