python - 最快重合矩阵

我有两个数组，我想计算一个巧合列表/数组。也就是说，所有索引 i、j 的列表，使得 a[i] == b[j]。这是我的代码:

b = np.array([3, 5, 6, 4])
a = np.array([1, 2, 3, 4])

np.array([[i, j] for i in range(a.size) for j in range(b.size) if a[i] == b[j]])

有没有更快的(也许是 numpy 支持的)方法来做到这一点？

最佳答案

方法#1

一种方法是使用 np.in1d -

m_a = np.in1d(a,b)
I = np.flatnonzero(m_a)
J = np.flatnonzero(np.in1d(b, a[m_a]))

示例输入、输出-

In [367]: a
Out[367]: array([1, 2, 3, 4])

In [368]: b
Out[368]: array([3, 5, 6, 4])

In [370]: I
Out[370]: array([2, 3])

In [371]: J
Out[371]: array([0, 3])

方法#2

另一种直接但占用大量内存的方法是使用广播 -

I,J = np.nonzero(a[:,None] == b)

方法#3

对于输入数组中没有重复项的情况，我们可以使用 np.searchsorted。这里有两种变体 - 一种用于排序的 a，另一种用于通用 a。

变体 #1: 对于排序的 a -

idx = np.searchsorted(a, b)
idx[idx==a.size] = 0
mask = a[idx] == b
I = np.searchsorted(a,b[mask])
J = np.flatnonzero(mask)

变体#2:对于这种通用变体情况，我们需要使用 a 的 argsort 索引 -

sidx = a.argsort()
a_sort = a[sidx]
idx = np.searchsorted(a_sort, b)
idx[idx==a.size] = 0
mask = a_sort[idx] == b
I = sidx[np.searchsorted(a_sort,b[mask])]
J = np.flatnonzero(mask)

关于python - 最快重合矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47475611/

上一篇：多个模块的 Python 单元测试覆盖率

下一篇：python - 如果一个值相同而另一个值较低，则从列表中删除字典

相关文章：

python 3。在值字典中查找数组的值

python - 在 Python 中将日期转换为日期时间

python - ValueError : Expected n_neighbors <= 1. Got 5 -Scikit K 最近分类器

python - numpy.array 中没有 Fortran 顺序

python - 如何在没有循环的情况下修改特定位置的 2D numpy 数组？

python - 从根目录导入模块

python - Zope 安装到错误的版本(easy_install 和 pip)

python - 在 picamera 预览上叠加透明 png 很难看

python - 结果稀疏性已知时的稀疏矩阵乘法(在 python|scipy|cython 中)

python - 如何删除 numpy 数组中的维度？