更新:scipy.stats.gaussian_kde
现在支持加权样本。参见 here和 here了解详情。
目前无法使用 scipy.stats.gaussian_kde
根据 weighted samples 估计随机变量的密度.基于加权样本估计连续随机变量密度的方法有哪些?
最佳答案
都不是sklearn.neighbors.KernelDensity
也不statsmodels.nonparametric
似乎支持加权样本。我修改了 scipy.stats.gaussian_kde
以允许异构采样权重,并认为结果可能对其他人有用。示例如下所示。
ipython
notebook 可以在这里找到:http://nbviewer.ipython.org/gist/tillahoffmann/f844bce2ec264c1c8cb5
实现细节
加权算术平均值为
unbiased data covariance matrix然后由
带宽可以通过 scott
或 silverman
规则来选择,就像在 scipy
中一样。然而,用于计算带宽的样本数是Kish's approximation for the effective sample size。 .
关于python - `python` 中的加权高斯核密度估计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27623919/