r - k表示聚类结果存储以备后用

我正在探索 R 编程环境来对我的测试数据执行聚类分析。为了进行测试，我使用单列数据集，并根据值索引绘制了以下散点图和直方图。

enter image description here

enter image description here 从数据来看，我觉得这些值可以分为 7 个簇。当我使用 kmeans 函数且 cluster 参数为 7 时，我得到以下结果。

在簇内按簇计算平方和: [1] 492.480 2979.013 1903.396 18682.262 1430.533 754221.504 (之间_SS/总_SS = 98.3 %)

现在我的疑问是如何存储这个结果(不一定在 r 中)，以便当我获得新的数据集时我应该能够比较 i/p已存储聚类结果的数据集。我应该能够将 i/p 数据集值划分到已知的集群中。

最佳答案

检查 help(kmeans) 的Value部分。中心会告诉您平均值的中心在哪里。对于传入数据，计算它最接近哪个中心。示例:

data(mtcars)
mt.k <- kmeans(mtcars, centers = 4)
mt.k$centers

关于r - k表示聚类结果存储以备后用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29035427/

相关文章：

sql - 如何使用自连接更快地进行查询？