machine-learning - ELKI 层次聚类 - "mrg_"Cluster 对象

标签 machine-learning cluster-analysis data-mining hierarchical-clustering elki

我正在使用ELKI's SimplifiedHierarchyExtractionAnderbergHierarchicalClustering , LatLngDistanceFunctionminClSize = 100 .

我在"clu_" Clusters旁边看到了这个还有 2 -3 "mrg_" Clusters其中有一些DBID's ,但其编号是 < minClSize .

我的问题是:处理这个问题的最佳方法是什么"mrg_" Clusters? :

  • 通过其 DBID´s"clu_" children 之一?
  • 将它们视为a cluster尽管它们属于 minClSize
  • 干脆无视他们?

最佳答案

这是一个分层结果。

您需要将所有子集群包含到一个集群中。

因此,mrg_ 集群有一些(可能是 0 个)新对象,加上子集群中的所有这些对象。特别是,它可以有多个子集群(这就是为什么它被称为合并)

关于machine-learning - ELKI 层次聚类 - "mrg_"Cluster 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35596246/

相关文章:

machine-learning - 在语言建模中,为什么我必须在每个新的训练周期之前 init_hidden 权重? ( torch )

java - MapReduce 中的层次聚类实现代表性链接社区的树状图

r - clusplot - 显示变量

artificial-intelligence - 信息挖掘、分类、修改

machine-learning - 对于 98% 的列都是空值的数据集,我们能做什么呢?

python - 从 Python 以 `.cpp` 格式保存 LGBM 模型

python - 在 sklearn 中使用 Boosting 树生成特征

machine-learning - 使用熵的加权决策树

r - 优化修剪后的 K 均值以对具有许多异常值的 2D 数据进行聚类?更好的方法?

java - J48 在 weka 资源管理器中不工作