我一直在研究和研究基于分区的聚类算法,如 K-means 和 K-Medoids。我了解到,与 K-means 相比,K-medoids 对于离群值更稳健。但是,我很好奇如果在分配数据点期间,两个或多个集群代表在数据点上具有相同的距离,将会发生什么。您将分配哪个集群的数据点?将数据点分配到一个簇中是否会对聚类结果产生很大影响?
最佳答案
为了防止不好的事情发生(无限循环等),在绑定(bind)时总是优先选择已经分配给该点的集群。
关于algorithm - K-Medoids/K-Means 算法。两个或多个聚类代表之间距离相等的数据点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46368307/