python - NumPy 数组的有效(非 NaN)部分的开始、停止索引切片

标签 python numpy

我有一个包含 nans 的大型 numpy 1d 数组。我需要知道所有不包含任何 nan 的切片:

 import numpy as np
 A=np.array([1.0,2.0,3.0,np.nan,4.0,3.0,np.nan,np.nan,np.nan,2.0,2.0,2.0])

该示例的预期结果是:

 Slices=[slice(0,3),slice(4,6),slice(9,12)]

最佳答案

一种获取此类切片列表的方法,其思想是在列表理解中执行最少的工作 -

def start_stop_nonNaN_slices(A):
    mask = ~np.isnan(A)
    mask_ext = np.r_[False, mask, False]
    idx = np.flatnonzero(mask_ext[1:] != mask_ext[:-1]).reshape(-1,2)
    return [slice(i[0],i[1]) for i in idx]

示例运行 -

In [32]: A
Out[32]: 
array([  1.,   2.,   3.,  nan,   4.,   3.,  nan,  nan,  nan,   2.,   2.,
         2.])

In [33]: start_stop_nonNaN_slices(A)
Out[33]: [slice(0, 3, None), slice(4, 6, None), slice(9, 12, None)]

In [35]: A
Out[35]: 
array([ nan,   1.,   2.,   3.,  nan,   4.,   3.,  nan,  nan,  nan,   2.,
         2.,   2.])

In [36]: start_stop_nonNaN_slices(A)
Out[36]: [slice(1, 4, None), slice(5, 7, None), slice(10, 13, None)]

以不同格式输出

我。如果您需要这些开始、停止索引作为元组对 -

def start_stop_nonNaN_slices_v2(A):
    mask = ~np.isnan(A)
    mask_ext = np.r_[False, mask, False]
    idx = np.flatnonzero(mask_ext[1:] != mask_ext[:-1])
    return zip(idx[::2], idx[1::2])

示例运行 -

In [51]: A
Out[51]: 
array([ nan,   1.,   2.,   3.,  nan,   4.,   3.,  nan,  nan,  nan,   2.,
         2.,   2.,  nan,  nan])

In [52]: start_stop_nonNaN_slices_v2(A)
Out[52]: [(1, 4), (5, 7), (10, 13)]

二.如果您同意将开始索引和停止索引作为两个输出数组,并且这应该非常有效,因为我们避免了任何列表理解或压缩 -

def start_stop_nonNaN_slices_v3(A):
    mask = ~np.isnan(A)
    mask_ext = np.r_[False, mask, False]
    idx = np.flatnonzero(mask_ext[1:] != mask_ext[:-1])
    return idx[::2], idx[1::2]

示例运行 -

In [74]: A
Out[74]: 
array([ nan,   1.,   2.,   3.,  nan,   4.,   3.,  nan,  nan,  nan,   2.,
         2.,   2.,  nan,  nan])

In [75]: starts, stops = start_stop_nonNaN_slices_v3(A)

In [76]: starts
Out[76]: array([ 1,  5, 10])

In [77]: stops
Out[77]: array([ 4,  7, 13])

性能注意事项:为了性能,我们可以使用np.concatenate来替换np.r_:

mask_ext = np.concatenate(( [False], mask, [False] ))

关于python - NumPy 数组的有效(非 NaN)部分的开始、停止索引切片,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43982063/

相关文章:

python - 按数据帧中的行计算非零值的非重叠运行

python - numpy fft 在绘图时返回原始频率

python - 如何使用 'input'在python 3.x中输入数学函数作为变量

python - 使用 dictConfig 的 Django 日志记录找不到 "logging"模块

python - 在 Python 中,如何检查列表中的 2 个数字是否在彼此的一定百分比内?

python - 在 Python 中,如何通过键列连接两个数组?

python - 创建矩阵(数组),其中每个元素本身就是一个矩阵

python - 迭代 numpy 数组,根据给定标准有选择地选取一个或两个值

python - 如何使用 Python 将 Azure 中的文件从一个存储帐户复制到另一个存储帐户?

python - DjangoCMS : how to auto-add default plugins in placeholders