我正在使用 R 包 mclust 来估计数据中的簇数并获得以下结果:
Clustering table:
2 7 8 9
205693 4465 2418 91
Warning messages:
1: In map(z) : no assignment to 1,3,4,5,6
2: In map(z) : no assignment to 1,3,4,5,6
我有 9 个最好的簇,但它没有分配给其中 5 个簇。 那么这是否意味着我想使用 9 个或 5 个集群?
如果可以在网上找到答案,我们将不胜感激。提前致谢。
最佳答案
很可能,该方法对您的数据根本不起作用...
您可以尝试其他种子,因为当您“丢失”簇(即它们变空)时,这通常意味着您的种子选择得不够好。你的集群 9 也几乎消失了。
但是,如果您的数据实际上是由高斯混合生成的,则很难找到如此糟糕的起点...因此很可能,您的所有结果都是不好的,因为数据不满足您的假设。
从您的集群大小来看,我认为您有 1 个集群和大量噪音...
您是否可视化并验证了结果?
不要盲目跟随某个数字。验证。
关于r - 解释 R Mclust 包的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22293570/