Python k-means 算法

我正在寻找 k-means 算法的 Python 实现以及用于集群和缓存我的坐标数据库的示例。

最佳答案

更新:(在这个原始答案发布 11 年后，可能是时候更新了。)

首先，您确定要使用 k-means 吗？ This page给出了一些不同聚类算法的优秀图形总结。我建议在图形之外，特别查看每个方法所需的参数并决定是否可以提供所需的参数(例如，k-means 需要集群的数量，但也许在开始之前你不知道聚类)。

这里有一些资源:

旧答案:

Scipy's clustering实现运行良好，它们包括 k-means实现。

还有scipy-cluster , 进行凝聚聚类；这样做的好处是您不需要提前决定集群的数量。

关于Python k-means 算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1545606/