machine-learning - 使用 WEKA 选择 Xmeans 中的最小和最大簇数

我发现 WEKA 界面需要在运行 X-means 聚类算法之前指定最小和最大聚类数。确定这些数字的好方法是什么？ X-means 不是应该消除选择簇数量的负担吗？

最佳答案

您可以使用您拥有的任何数据背景知识来设置最小和最大聚类数。 XMeans 减轻了您的一些负担，因为它不需要您指定簇的数量，而只指定簇数量的界限。如果您没有背景知识，您可以将它们设置为非常低和非常高的值。

例如，如果您想对 stackoverflow 上的问题进行聚类，并且知道分配给每个问题的标签，则可以根据标签总数、每个问题的标签等得出界限。

this question 的答案可能有帮助。一般来说，您必须尝试不同的值，看看哪个会产生您最喜欢的结果。

关于machine-learning - 使用 WEKA 选择 Xmeans 中的最小和最大簇数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32462300/

相关文章：

machine-learning - 集成模型和平均模型有什么区别？