是否有任何类型的聚类算法专注于形成特定大小的聚类?这可以将我们视为一种分组算法,而不是一种聚类算法。
基本上,给定 n 个数据点和一定大小 k 的固定组,根据某些分类器找到点到集合的最佳分布,这将有望最小化给定组中每个点的分类器距离。
这个问题似乎与聚类问题非常相似,但主要区别在于我们关心特定的聚类大小,而不关心聚类的数量。
最佳答案
有一个关于如何在 ELKI 中实现此类算法的教程:
http://elki.dbs.ifi.lmu.de/wiki/Tutorial/SameSizeKMeans
还可以看看约束聚类算法;尽管通常这些算法仅支持“必须链接”和“不能链接”约束,而不支持大小约束。
您应该能够进行类似的修改,首先指定组大小,然后随机分配点,并在目标函数改进时交换集群成员;类似于 k-means/k-medoids。由于您可能会陷入局部最小值,因此请重新启动多次并只保留最好的。
另请参阅之前的问题,例如 K-means algorithm variation with equal cluster size 和 Group n points in k clusters of equal size
关于python - 具有特定大小的组的聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23588329/