algorithm - K-Medoids/K-Means 算法。两个或多个聚类代表之间距离相等的数据点

标签 algorithm distance data-mining k-means

我一直在研究和研究基于分区的聚类算法，如 K-means 和 K-Medoids。我了解到，与 K-means 相比，K-medoids 对于离群值更稳健。但是，我很好奇如果在分配数据点期间，两个或多个集群代表在数据点上具有相同的距离，将会发生什么。您将分配哪个集群的数据点？将数据点分配到一个簇中是否会对聚类结果产生很大影响？

最佳答案

为了防止不好的事情发生(无限循环等)，在绑定(bind)时总是优先选择已经分配给该点的集群。

关于algorithm - K-Medoids/K-Means 算法。两个或多个聚类代表之间距离相等的数据点，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46368307/

上一篇：algorithm - 服务器中 volatile 状态的 raft 协议(protocol)中的 lastApplied 和 matchIndex 是什么？

下一篇：c++ - 在 O(n) 时间 O(n) 内存中计算 max(min(A[i .. i+d]))

相关文章：

javascript - 需要帮助计算 24 小时内 4 个实例停工之间的时差

algorithm - 如何分割二进制字符串？

algorithm - 整数的部分和与差的整除

java - 如何编写更短的排序和分组算法？

mysql - 半正矢距离 - MySQL 和 PHP 对于相同的公式返回不同的结果

mysql - Haversine 公式在查询中返回 null

algorithm - 用常用词监控品牌

machine-learning - 通过关键词聚类进行主题检测

machine-learning - Weka java库: how to get string representation of classified instance?

r - 在 R 中构造距离矩阵，但来自多个输入矩阵