statistics - 如何从一组加权样本中估计高斯(混合)密度?

标签 statistics machine-learning estimation gaussian

假设我有一组加权样本,其中每个样本都有一个介于 0 和 1 之间的相应权重。我想估计高斯混合分布的参数,该分布偏向于具有较高权重的样本。在通常的非加权情况下,高斯混合估计是通过 EM 算法完成的。

是否有允许传递权重的实现(任何语言都可以)?如果不是,我该如何修改算法来考虑权重?如果不是,如何将权重纳入问题的最大对数似然公式的初始公式中?

最佳答案

我刚刚也遇到了同样的问题。尽管该帖子较旧,但其他人可能会感兴趣。 honk的答案原则上是正确的,只是不能立即看出它如何影响算法的实现。来自维基百科文章 Expectation Maximization和一个非常好的Tutorial ,可以轻松导出变化。

如果 $v_i$ 是第 i 个样本的权重,则教程中的算法(请参阅第 6.2 节末尾)会发生变化,以便 $gamma_{ij}$ 乘以该权重因子。 为了计算新的权重 $w_j$,$n_j$ 必须除以权重 $\sum_{i=1}^{n} v_i$ 的总和,而不仅仅是 n。就是这样...

关于statistics - 如何从一组加权样本中估计高斯(混合)密度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2492674/

相关文章:

c++ - 如何创建包含(人工生成的)高斯(正态)分布的 vector ?

machine-learning - 在推荐系统中使用决策树

java - 用于保存感知器数据的自定义类 - 可能未正确填充

python - T5 微调模型输出 而不是大括号和其他特殊字符

language-agnostic - 如何处理霍夫施塔特定律?

r - 当从二项式随机变量建模值时,Stan/RStan 中 if() 条件的问题

c - 在ubuntu linux中查找用户的资源利用率

f# - F#的统计功能(或.NET库)

search - 将 Google/Yahoo 搜索嵌入网站或构建您自己的网站

opencv - block bundle 调整流程