r - k 表示聚类限制?

标签 r k-means

我正在进行 kmeans 聚类分析我的数据。到目前为止它工作完美。 到目前为止,这是我的代码:

library(Ckmeans.1d.dp)
file=read.csv(file.choose(),header=T)
attach(file)
sortfile=file[order(normalized),]
results=Ckmeans.1d.dp(normalized,3)
plot(results)

现在,我能够获得集群和中心,但我更感兴趣的是获得集群的“限制”。不是我用的数据中一个集群中的最大值,而是我现在拥有的集群的极限。那可能吗?我该怎么做?

最佳答案

K-Means 根据最近的质心(聚类中心)标记点。因此,聚类之间的“限制”(称为决策边界)是至少有两个不同的质心作为它们最近的质心(例如,与它们的距离完全相同)的点。

例如在 2D 中,对于平面中的每个点计算它最近的质心。如果它有多个(例如,至少有两个质心距离它最近),那么它就是决策边界的一部分。

关于r - k 表示聚类限制?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44009131/

相关文章:

r - 如何使用 dplyr 在具有过滤功能的函数内应用 for 循环?

r - 如何将外部数据文件添加到开发 R 包中?

python - k-means 使用从 minhash 生成的签名矩阵

hadoop - hadoop 上的 Kmeans

r - 如何使输出的txt文件看起来更好

r - 条形图位置上的ggplot标签

r - 向图像/轮廓图添加点画

python - 此 kmeans 聚类的最佳 k 是多少? (肘点图)

nlp - 您如何使用 word2vec 计算 k-means 的文本文档之间的距离?

cluster-analysis - 使用 k 均值聚类时如何确定 k?