我正在探索 R 编程环境来对我的测试数据执行聚类分析。为了进行测试,我使用单列数据集,并根据值索引绘制了以下散点图和直方图。
从数据来看,我觉得这些值可以分为 7 个簇。当我使用 kmeans
函数且 cluster 参数为 7 时,我得到以下结果。
在簇内按簇计算平方和:
[1] 492.480 2979.013 1903.396 18682.262 1430.533 754221.504
(之间_SS/总_SS = 98.3 %)
现在我的疑问是如何存储这个结果(不一定在 r 中),以便当我获得新的数据集时我应该能够比较 i/p已存储聚类结果的数据集。我应该能够将 i/p 数据集值划分到已知的集群中。
最佳答案
检查 help(kmeans)
的Value部分。中心会告诉您平均值的中心在哪里。对于传入数据,计算它最接近哪个中心。示例:
data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers
关于r - k表示聚类结果存储以备后用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29035427/