statistics - 如何从一组加权样本中估计高斯(混合)密度？

已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。

我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题，以便用事实和引文来回答。

已关闭 2 年前。

假设我有一组加权样本，其中每个样本都有一个介于 0 和 1 之间的相应权重。我想估计高斯混合分布的参数，该分布偏向于具有较高权重的样本。在通常的非加权情况下，高斯混合估计是通过 EM 算法完成的。

是否有允许传递权重的实现(任何语言都可以)？如果不是，我该如何修改算法来考虑权重？如果不是，如何将权重纳入问题的最大对数似然公式的初始公式中？

最佳答案

我刚刚也遇到了同样的问题。尽管该帖子较旧，但其他人可能会感兴趣。 honk的答案原则上是正确的，只是不能立即看出它如何影响算法的实现。来自维基百科文章 Expectation Maximization和一个非常好的Tutorial ，可以轻松导出变化。

如果 $v_i$ 是第 i 个样本的权重，则教程中的算法(请参阅第 6.2 节末尾)会发生变化，以便 $gamma_{ij}$ 乘以该权重因子。为了计算新的权重 $w_j$，$n_j$ 必须除以权重 $\sum_{i=1}^{n} v_i$ 的总和，而不仅仅是 n。就是这样...

关于statistics - 如何从一组加权样本中估计高斯(混合)密度？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2492674/

相关文章：

c++ - 如何创建包含(人工生成的)高斯(正态)分布的 vector ？