python - 在python中执行K-means算法后得到第i个簇

标签 python algorithm scikit-learn k-means

我尝试使用 Python 中的“scikit-learn”库使用 K-means 算法对矩阵中的多个点进行分类。这是我到目前为止所做的:

k_means = KMeans(init='k-means++', k=5, n_init=10)
k_means.fit(X) ## X is the matrix containing the data
... # some code to plot

结果如下:

enter image description here

例如,现在我想获取“红色”集群中的点。我如何使用 sklearn 做到这一点?

最佳答案

KMeans 是一个公式而不是数据库。我的意思是它不会记录每条记录的值,它会记录一个函数,该函数将再次分配给定输入的集群。要获得聚类分配,有一种称为“预测”的方法。

kmeans.predict(value)

这将为您提供来自 kmeans 的集群分配。如果你遍历你的点,你应该能够得到它们。

关于python - 在python中执行K-means算法后得到第i个簇,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26975446/

相关文章:

python - 我试图将骰子游戏分数写入文件,但我收到这样的类型错误。类型错误 : write() argument must be str, 不是元组

python - 为什么我们在通过 super 调用时必须使用 __dunder__ 方法而不是运算符?

python - 使用 OpenCV 检测圆形区域(有很多小物体)

python - 如何将事件传递给父 tkinter 小部件?

python - 生成所有可能的 n 维 k*k*...*k 数组,每个数组沿轴有一排

寻找最佳组合的算法

php - 对数标度 - PHP 排名

python - 使用来自 sklearn.feature_extraction.text.TfidfVectorizer 的 TfidfVectorizer 计算 IDF

python - 使用 scikit-learn 对大型数据集进行一次性编码

scikit-learn - 分类 - 修改后的 huber 损失 : how is it more tolerant to outliers?