我正在寻找 k-means 算法的 Python 实现以及用于集群和缓存我的坐标数据库的示例。
最佳答案
更新:(在这个原始答案发布 11 年后,可能是时候更新了。)
首先,您确定要使用 k-means 吗? This page给出了一些不同聚类算法的优秀图形总结。我建议在图形之外,特别查看每个方法所需的参数并决定是否可以提供所需的参数(例如,k-means 需要集群的数量,但也许在开始之前你不知道聚类)。
这里有一些资源:
旧答案:
Scipy's clustering实现运行良好,它们包括 k-means实现。
还有scipy-cluster , 进行凝聚聚类;这样做的好处是您不需要提前决定集群的数量。
关于Python k-means 算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1545606/