我有一个用 R 导入的 2D 数据集 - (x,y)
坐标。我想在这个数据集上执行 k-means 聚类,但我想将具体坐标设置为初始中心。例如,我想从 5 个中心开始,它们的值是 (5, 10), (3, 8), (46, 22), (87, 66), (39, 41)
.
我在 kmeans 函数中看到了一个中心参数,但我不明白如何将我的值设置为中心。
kmeans(data, centers = ...) # what to set here?
最佳答案
centers
参数采用整数 k
,在这种情况下 k
来自 data
的随机点被选为初始中心,或初始中心矩阵,列数为 data
.尝试这个:
x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
kmeans(x,centers=3)
kmeans(x,centers=x[1:3,])
关于R k-means 算法自定义中心,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29605911/