python - Python 中具有 nan 值的数组之间的平均值

标签 python arrays numpy average nan

我在Python中有三个数组

a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])

我需要计算平均值以获得以下数组:

>>> myavg 
array([[ 10.,  10,  10.,  10.],
       [ 10,  10.,  10.,  10.],
       [ 10.,  10.,  nan,  10.]])

第一步是转换新的 [0,1] 数组中的数组并求和(即 3 = 每个数组中有数据,2 = 仅两个数组中的数据,1 = 多个数组中的数据,0 = 无数据)

aa = a.copy()
bb = b.copy()
cc = c.copy()
aa[aa == 10.] = 1
aa[aa != 1] = 0
bb[bb == 10.] = 1
bb[bb != 1] = 0
cc[cc == 10.] = 1
cc[cc != 1] = 0
dd = aa + bb + cc

>>> dd
array([[ 3.,  2.,  3.,  3.],
       [ 2.,  2.,  3.,  1.],
       [ 3.,  3.,  0.,  3.]])

第二个是对所有原始数组求和,然后除以 dd

c = a+b+c
>>> c
array([[ 30.,  nan,  30.,  30.],
       [ nan,  nan,  30.,  nan],
       [ 30.,  30.,  nan,  30.]])

问题很明显。当我将一个值与 nan 相加时,我得到 nan。我无法将 nan 转换为“0”,因为在我的实际情况中 0 是一个值(即温度)

最佳答案

您可以将 abc 放入一个 3 维数组中,然后使用 numpy.nanmean :

In [2]: %paste
a = np.array([[10., 10., 10., 10.], [10., nan, 10., 10.], [10., 10., nan, 10.]])
b = np.array([[10., 10., 10., 10.], [10., 10., 10., nan], [10., 10.,nan, 10]])
c = np.array([[10., nan, 10., 10.], [nan, 10., 10., nan], [10., 10.,nan, 10]])

## -- End pasted text --

In [3]: m = np.array([a, b, c])

In [4]: np.nanmean(m, axis=0)
/Users/warren/anaconda/lib/python2.7/site-packages/numpy/lib/nanfunctions.py:675: RuntimeWarning: Mean of empty slice
  warnings.warn("Mean of empty slice", RuntimeWarning)
Out[4]: 
array([[ 10.,  10.,  10.,  10.],
       [ 10.,  10.,  10.,  10.],
       [ 10.,  10.,  nan,  10.]])

出现警告是因为在一种情况下,所有被平均的值都是 nan。

关于python - Python 中具有 nan 值的数组之间的平均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34562736/

相关文章:

php - php中的3级数组用于组织数据

ios - 尝试在 Swift 中访问嵌套字典数组中的键

python - 如何将文本文件中的十六进制行转换为数组(Python)?

python - 如何以python方式检查长时间运行的函数?

javascript - 为什么 Oranges 和 abc 数组得到相同的输出?

python - 从源码下载了python3.5,但是pip3不存在

python - 有没有更快的方法来达到相同的结果?

python - 有没有办法让这段代码更通用、更优雅?

python 自省(introspection)不显示 Lock 的函数

python - pandas 将 rows/groupby 与分类数据和大量 nan 值连接起来