r - 解释 R Mclust 包的结果

标签 r cluster-analysis

我正在使用 R 包 mclust 来估计数据中的簇数并获得以下结果:

Clustering table:
     2      7      8      9 
205693   4465   2418     91 
Warning messages:
1: In map(z) : no assignment to 1,3,4,5,6
2: In map(z) : no assignment to 1,3,4,5,6

我有 9 个最好的簇,但它没有分配给其中 5 个簇。 那么这是否意味着我想使用 9 个或 5 个集群?

如果可以在网上找到答案,我们将不胜感激。提前致谢。

最佳答案

很可能,该方法对您的数据根本不起作用...

您可以尝试其他种子,因为当您“丢失”簇(即它们变空)时,这通常意味着您的种子选择得不够好。你的集群 9 也几乎消失了。

但是,如果您的数据实际上是由高斯混合生成的,则很难找到如此糟糕的起点...因此很可能,您的所有结果都是不好的,因为数据不满足您的假设。

从您的集群大小来看,我认为您有 1 个集群和大量噪音...

您是否可视化并验证了结果?

不要盲目跟随某个数字。验证。

关于r - 解释 R Mclust 包的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22293570/

相关文章:

r - R 中 with() 和 attach() 之间的行为有细微的不同吗?

R - 平滑颜色并向散点图添加图例

R:向 data.frame 添加列以分为低、中、高范围

r - Flexdashboard 中仪表颜色褪色

Python序列聚类练习

r - 因子分析中的错误 - 起始值

r - 时间序列的快速傅里叶变换和聚类

algorithm - bool 值的多维聚类

machine-learning - 变量随时间变化(趋势)的时间顺序故障检测

python - Pyspark 数据帧 : Creating a features column to be used in the clustering in python