r - k 表示聚类限制？

我正在进行 kmeans 聚类分析我的数据。到目前为止它工作完美。到目前为止，这是我的代码:

library(Ckmeans.1d.dp)
file=read.csv(file.choose(),header=T)
attach(file)
sortfile=file[order(normalized),]
results=Ckmeans.1d.dp(normalized,3)
plot(results)

现在，我能够获得集群和中心，但我更感兴趣的是获得集群的“限制”。不是我用的数据中一个集群中的最大值，而是我现在拥有的集群的极限。那可能吗？我该怎么做？

最佳答案

K-Means 根据最近的质心(聚类中心)标记点。因此，聚类之间的“限制”(称为决策边界)是至少有两个不同的质心作为它们最近的质心(例如，与它们的距离完全相同)的点。

例如在 2D 中，对于平面中的每个点计算它最近的质心。如果它有多个(例如，至少有两个质心距离它最近)，那么它就是决策边界的一部分。

关于r - k 表示聚类限制？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44009131/

上一篇：coq - Coq证明中如何加强归纳假设？

下一篇：R:写入文件时不带尾随换行符

相关文章：

r - 如何使用 dplyr 在具有过滤功能的函数内应用 for 循环？

r - 如何将外部数据文件添加到开发 R 包中？

python - k-means 使用从 minhash 生成的签名矩阵

hadoop - hadoop 上的 Kmeans

r - 如何使输出的txt文件看起来更好

r - 条形图位置上的ggplot标签

r - 向图像/轮廓图添加点画

python - 此 kmeans 聚类的最佳 k 是多少？ (肘点图)

nlp - 您如何使用 word2vec 计算 k-means 的文本文档之间的距离？

cluster-analysis - 使用 k 均值聚类时如何确定 k？