r - k表示聚类结果存储以备后用

标签 r cluster-analysis k-means

我正在探索 R 编程环境来对我的测试数据执行聚类分析。为了进行测试,我使用单列数据集,并根据值索引绘制了以下散点图和直方图。

enter image description here

enter image description here 从数据来看,我觉得这些值可以分为 7 个簇。当我使用 kmeans 函数且 cluster 参数为 7 时,我得到以下结果。

在簇内按簇计算平方和: [1] 492.480 2979.013 1903.396 18682.262 1430.533 754221.504 (之间_SS/总_SS = 98.3 %)

现在我的疑问是如何存储这个结果(不一定在 r 中),以便当我获得新的数据集时我应该能够比较 i/p已存储聚类结果的数据集。我应该能够将 i/p 数据集值划分到已知的集群中。

最佳答案

检查 help(kmeans)Value部分。中心会告诉您平均值的中心在哪里。对于传入数据,计算它最接近哪个中心。示例:

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers

关于r - k表示聚类结果存储以备后用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29035427/

相关文章:

sql - 如何使用自连接更快地进行查询?

r - 选择具有连续年度季度的组

r - 用 R 制作一份关于 Latex 的漂亮报告

python - SKLearn KMeans收敛警告

非线性可分数据的 Matlab kmeans 聚类

r - R 中函数的优化(L-BFGS-B 需要 'fn' 的有限值)

machine-learning - 具有余弦距离的 K 均值

algorithm - 聚类算法和 "extending"聚类以包括 N 个最近的邻居

r - 如何在集群中绘制多维数据

python-2.7 - 使用杰卡德相似度对分类数据进行聚类