我有一个加权移动平均函数,它通过使用高斯加权机制对每个点左侧和右侧的 3*宽度值进行平均来平滑曲线。我只担心平滑以 [start, end] 为界的区域。以下代码可以工作,但问题是大型数组的运行时。
import numpy as np
def weighted_moving_average(x, y, start, end, width = 3):
def gaussian(x, a, m, s):
return a*exp(-(x-m)**2/(2*s**2))
cut = (x>=start-3*width)*(x<=end+3*width)
x, y = x[cut], y[cut]
x_avg = x[(x>=start)*(x<=end)]
y_avg = np.zeros(len(x_avg))
bin_vals = np.arange(-3*width,3*width+1)
weights = gaussian(bin_vals, 1, 0, width)
for i in range(len(x_avg)):
y_vals = y[i:i+6*width+1]
y_avg[i] = np.average(y_vals, weights = weights)
return x_avg, y_avg
根据我的理解,循环 NumPy 数组通常效率很低。我想知道是否有人有想法用运行时效率更高的东西来替换 for 循环。
谢谢
最佳答案
加权窗口上的切片和求和/平均基本上对应于内核被翻转的一维卷积。现在,对于 1D
convolution ,NumPy 在 np.convolve
中有一个非常高效的实现这可以用来摆脱循环并给我们y_avg
。因此,我们将有一个像这样的矢量化实现 -
y_sums = np.convolve(y,weights[::-1],'valid')
y_avg = np.true_divide(y_sums,weights.sum())
关于python - 提高加权移动平均过滤函数的运行时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38491572/