我必须使用EM来估计两个类中每个类的高斯分布的均值和协方差。他们也有一些缺失的属性。
每个对象的类都是已知的。因此,问题基本上简化为拟合缺失元素的高斯模型。
哪个是最好使用的库?
ECM算法与EM算法有何不同?
最佳答案
如果您有权访问统计工具箱,则可以使用 GMDISTRIBUTION使用 EM 算法拟合高斯混合模型的类。
这是一个例子:
%# sample dataset
load fisheriris
data = meas(:,1:2);
label = species;
%# fit GMM using EM
K = 2;
obj = gmdistribution.fit(data, K);
%# assign points to mixtures: argmax_k P(M(k)|data)
P = posterior(obj, data);
[~,mIDX] = max(P,[],2);
%# GMM components
obj.mu %# means
obj.Sigma %# covariances
obj.PComponents %# mixture weights
%# visualize original data clusters
figure
gscatter(data(:,1), data(:,2), label)
%# visualize mixtures found
figure
gscatter(data(:,1), data(:,2), mIDX), hold on
ezcontour(@(x,y)pdf(obj,[x y]), xlim(), ylim())
如果没有,请查看优秀的 Netlab Toolbox ,因为它有 GMM 实现。
关于matlab - Matlab 中缺失数据的期望最大化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7317836/