machine-learning - 最大似然参数估计

标签 machine-learning bayesian mle

给定这个数据集:

颜色 |尺寸

红色|大

白色|小

红色|大

红色|小

白色|大

红色|大

和以下贝叶斯网络:颜色 --> 大小,我应该找到贝叶斯网络的最大似然参数。估算师会是什么?我不知道如何继续这里,因此我们将不胜感激任何帮助。

最佳答案

假设您的“颜色”和“尺寸”变量服从多项式分布,您需要估计以下参数 theta :

对于颜色:

  • Theta_red :红色概率。
  • Theta_white :白色概率。

尺寸:

  • Theta_big|red :给定红色的情况下,概率较大。
  • Theta_big|white :考虑到是白人,成为大人的概率。
  • Theta_small|red :给定红色的概率很小。
  • Theta_small|white :考虑到是白人,概率很小。

最终只有 3 个,因为

  • theta_white = 1 - theta_red ,
  • theta_small|red = 1 - theta_big|red
  • theta_small|white = 1 - theta_big|white

可能性是给定模型的观测数据的概率,在本例中,对于具有 n 个颜色和大小观测值的数据集:

D = {(color_1, size_1), ..., (color_n, size_n)} ,

及参数:

theta = {theta_red, theta_big|red, theta_big|white} ,

可能性由下式给出:

Likelihood

由于我们在这里处理颜色和给定颜色的大小的伯努利分布,因此我们可以这样写:

enter image description here

哪里enter image description here是红色且小的观测值的数量,其他Ms的定义类似。

最后,通过优化似然函数,得到参数估计量:

  • enter image description here
  • enter image description here
  • enter image description here

关于machine-learning - 最大似然参数估计,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27426306/

相关文章:

python - 如何从 PyStan 中提取对数似然的后验样本?

python - 使用 scipy Optimize 进行 MLE 估计和曲线拟合

r - 包 `fitdistr()`中的 `fitdistrplus`函数拟合的幂律

python - 有没有办法在 sklearn 中进行 LabelBinarizer 变换后跟踪哪个 DataFrame 列对应于哪个数组列?

python - 使用 python 的朴素贝叶斯分类器

ruby - 什么是用于在大型 Rails 站点上构建灵活的垃圾邮件检测的优秀开源包?

r - 如何将权重合并到似然函数中?

machine-learning - 为什么 `sklearn.manifold.MDS` 是随机的,而 `skbio' s pcoa` 不是随机的?

tensorflow - 为什么深度学习模型没有与加州房价数据收敛?

cookies - 如何在虚拟机上通过命令行获取kaggle比赛数据?