R k-means 算法自定义中心

标签 r k-means

我有一个用 R 导入的 2D 数据集 - (x,y)坐标。我想在这个数据集上执行 k-means 聚类,但我想将具体坐标设置为初始中心。例如,我想从 5 个中心开始,它们的值是 (5, 10), (3, 8), (46, 22), (87, 66), (39, 41) .

我在 kmeans 函数中看到了一个中心参数,但我不明白如何将我的值设置为中心。

kmeans(data, centers = ...) # what to set here?

最佳答案

centers参数采用整数 k ,在这种情况下 k来自 data 的随机点被选为初始中心,或初始中心矩阵,列数为 data .尝试这个:

x <- rbind(matrix(rnorm(100, sd = 0.3), ncol = 2),
                 matrix(rnorm(100, mean = 1, sd = 0.3), ncol = 2))
kmeans(x,centers=3)
kmeans(x,centers=x[1:3,])

关于R k-means 算法自定义中心,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29605911/

相关文章:

python - 为什么在 Google Colab 中重新启动运行时 KMeans 的 silhouette_score 会发生变化?

r - 绘制 R 中的哪个参数?

R:因子水平,将其余重新编码为 'other'

r - 我自己的 R 中的 K-means 算法

r - 在 R 中使用 kmeans 查找中心索引

python-3.x - k 均值聚类中如何使用 tfidf 值

图像相似性和 k 均值聚类

R 删除重复的行,保留那些有值的行

r - 使用 gsub 在字符串中仅保留字母数字字符和空格

r - 无法在 Raspberry pi 3 B 中安装 R 3.6