假设您有以下数据集,其中观察到两个变量“颜色”和“大小”:
Color | Size ------+------ Red | Big White | Small Red | Small Red | Big White | Big Red | Big
您需要学习如下所示的贝叶斯网络的最大似然参数:
Color -> Size
您获得了表中描述的学习问题的更多数据,但新数据集包含缺失值。现在您可以使用哪种算法来学习最大似然参数?
最佳答案
如果您只是丢弃缺失值的案例,您将得到不准确的值。
因此您需要对概率进行预测,并且可以使用期望最大化算法来实现此目的。 http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm
关于machine-learning - 贝叶斯学习中的缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20499911/