python - 评估 K 意味着使用 python 进行聚类

我有一个数据集有点像这样:

enter image description here

我使用以下代码执行了K 均值聚类:

from scipy.cluster.vq import kmeans, vq
data=np.matrix(dataAll.ix[:,:-1])
centers, _ = kmeans(data, 3, iter=100)
cluster, _ = vq(data, centers)

在这里我想问一下如何评估k means clustering。我想获得精度、准确度、f measure 等值。

最佳答案

如果您有黄金标准/地面真实值，您可以使用我的代码 [ Link ] 计算成对精度、召回率、FScore 和 NMI。

注意，这篇文章是用印尼语写的，不过不用担心，你可以跳过所有的解释，直接看文章底部的代码。 [我写了 Matlab & Python 实现] python 代码是 this work 的分支 可用 here .

关于python - 评估 K 意味着使用 python 进行聚类，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29760880/

相关文章：

python - Python 中使用嵌套循环的两位数乘法表