python - 提高加权移动平均过滤函数的运行时间?

标签 python numpy runtime ipython vectorization

我有一个加权移动平均函数,它通过使用高斯加权机制对每个点左侧和右侧的 3*宽度值进行平均来平滑曲线。我只担心平滑以 [start, end] 为界的区域。以下代码可以工作,但问题是大型数组的运行时。

import numpy as np
def weighted_moving_average(x, y, start, end, width = 3):
    def gaussian(x, a, m, s):
        return a*exp(-(x-m)**2/(2*s**2))
    cut = (x>=start-3*width)*(x<=end+3*width)
    x, y = x[cut], y[cut]
    x_avg = x[(x>=start)*(x<=end)]
    y_avg = np.zeros(len(x_avg))
    bin_vals = np.arange(-3*width,3*width+1)
    weights = gaussian(bin_vals, 1, 0, width)
    for i in range(len(x_avg)):
        y_vals = y[i:i+6*width+1]
        y_avg[i] = np.average(y_vals, weights = weights)
    return x_avg, y_avg

根据我的理解,循环 NumPy 数组通常效率很低。我想知道是否有人有想法用运行时效率更高的东西来替换 for 循环。

谢谢

最佳答案

加权窗口上的切片和求和/平均基本上对应于内核被翻转的一维卷积。现在,对于 1D convolution ,NumPy 在 np.convolve 中有一个非常高效的实现这可以用来摆脱循环并给我们y_avg。因此,我们将有一个像这样的矢量化实现 -

y_sums = np.convolve(y,weights[::-1],'valid')
y_avg = np.true_divide(y_sums,weights.sum())

关于python - 提高加权移动平均过滤函数的运行时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38491572/

相关文章:

Django HTML 模板中的 Javascript 变量

python - 在 Python 中将整数 n 生成受限弱整数组合(或分区)为 k 部分

python - 将分隔符分隔的字符串转换为 numpy 数组的有效方法

python - 计算 nd 数组中相同子数组的最快方法?

excel - 是什么原因导致 Excel 宏中的 MS VB 运行时错误 -2147417848 (80010108)

C++ 均值和中值绝对偏差返回相同的奇怪符号

java - 通过java运行时和cygwin发送和接收多个ssh命令

python - Django PyTest - 不允许数据库访问即使使用 django_db 和装置也会出错?

python - 使用 Word2Vec.load() 时出现 Unpickling 错误

python - 使用多个切片对象反转 2D NumPy 数组