我发现 WEKA 界面需要在运行 X-means 聚类算法之前指定最小和最大聚类数。确定这些数字的好方法是什么? X-means 不是应该消除选择簇数量的负担吗?
最佳答案
您可以使用您拥有的任何数据背景知识来设置最小和最大聚类数。 XMeans 减轻了您的一些负担,因为它不需要您指定簇的数量,而只指定簇数量的界限。如果您没有背景知识,您可以将它们设置为非常低和非常高的值。
例如,如果您想对 stackoverflow 上的问题进行聚类,并且知道分配给每个问题的标签,则可以根据标签总数、每个问题的标签等得出界限。
this question 的答案可能有帮助。一般来说,您必须尝试不同的值,看看哪个会产生您最喜欢的结果。
关于machine-learning - 使用 WEKA 选择 Xmeans 中的最小和最大簇数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32462300/