python - 删除 NumPy 数组中的连续重复项

标签 python numpy duplicates

我想删除相互跟随的重复项,但不删除整个数组中的重复项。另外,我想保持顺序不变。

所以如果输入是[0 0 1 3 2 2 3 3],输出应该是[0 1 3 2 3]

我找到了使用 itertools.groupby() 的方法,但我正在寻找更快的 NumPy 解决方案。

最佳答案

a[np.insert(np.diff(a).astype(np.bool), 0, True)]
Out[99]: array([0, 1, 3, 2, 3])

总体思路是使用diff 找出数组中两个连续元素之间的差异。然后我们只索引那些给出非零差异的元素。但是由于diff的长度少了1,所以在索引之前,我们需要在diff数组的开头插入True

解释:

In [100]: a
Out[100]: array([0, 0, 1, 3, 2, 2, 3, 3])

In [101]: diff = np.diff(a).astype(np.bool)

In [102]: diff
Out[102]: array([False,  True,  True,  True, False,  True, False], dtype=bool)

In [103]: idx = np.insert(diff, 0, True)

In [104]: idx
Out[104]: array([ True, False,  True,  True,  True, False,  True, False], dtype=bool)

In [105]: a[idx]
Out[105]: array([0, 1, 3, 2, 3])

关于python - 删除 NumPy 数组中的连续重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37839928/

相关文章:

python - 将函数返回元组解包为键值对

php - 使用 PDO 设置 LIMIT 时忽略数据库重复项

c - 查找重复项的最快方法

c++ - 如何从 vector 中删除重复的单词?

python - 如何在 Flask 上显示我的 IP 地址?

jquery - 抓取使用ajax的网页

python - 如何更新 urwid 中显示的文本?

python - 如何根据多个条件从 numpy 数组中删除行?

python - 同时更新 theta0 和 theta1 以计算 python 中的梯度下降

python - 如何根据每行的第二个值将Python多维numpy数组导出到不同的文件?