python - `python` 中的加权高斯核密度估计

更新:scipy.stats.gaussian_kde 现在支持加权样本。参见 here和 here了解详情。

目前无法使用 scipy.stats.gaussian_kde 根据 weighted samples 估计随机变量的密度.基于加权样本估计连续随机变量密度的方法有哪些？

最佳答案

都不是sklearn.neighbors.KernelDensity也不statsmodels.nonparametric似乎支持加权样本。我修改了 scipy.stats.gaussian_kde 以允许异构采样权重，并认为结果可能对其他人有用。示例如下所示。

example

实现细节

加权算术平均值为

weighted arithmetic mean

带宽可以通过 scott 或 silverman 规则来选择，就像在 scipy 中一样。然而，用于计算带宽的样本数是Kish's approximation for the effective sample size。 .

关于python - `python` 中的加权高斯核密度估计，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27623919/

相关文章：

Python计算单行值的运行总和