machine-learning - 使用 WEKA 选择 Xmeans 中的最小和最大簇数

标签 machine-learning cluster-analysis weka unsupervised-learning

我发现 WEKA 界面需要在运行 X-means 聚类算法之前指定最小和最大聚类数。确定这些数字的好方法是什么? X-means 不是应该消除选择簇数量的负担吗?

最佳答案

您可以使用您拥有的任何数据背景知识来设置最小和最大聚类数。 XMeans 减轻了您的一些负担,因为它不需要您指定簇的数量,而只指定簇数量的界限。如果您没有背景知识,您可以将它们设置为非常低和非常高的值。

例如,如果您想对 stackoverflow 上的问题进行聚类,并且知道分配给每个问题的标签,则可以根据标签总数、每个问题的标签等得出界限。

this question 的答案可能有帮助。一般来说,您必须尝试不同的值,看看哪个会产生您最喜欢的结果。

关于machine-learning - 使用 WEKA 选择 Xmeans 中的最小和最大簇数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32462300/

相关文章:

machine-learning - 集成模型和平均模型有什么区别?

python - 在 gensim Word2Vec 模型中匹配单词和向量

java - 将附近的位置聚集到一个点并忽略较远的位置

python - 导入错误: cannot import name BayesianGaussianMixture

python - 使用python生成数据簇?

machine-learning - keras 基本优化器如何工作?

Python Pandas 回归

csv - ARFF 文件的 "Data"部分可以使用空格而不是逗号吗?

java - 如何用Java中的Weka获取聚集记录的值?

machine-learning - 我可以防止 J48 分类器在同一字段上 split 超过 x 次吗?