我正在使用ELKI's SimplifiedHierarchyExtraction
与 AnderbergHierarchicalClustering
, LatLngDistanceFunction
和minClSize = 100
.
我在"clu_" Clusters
旁边看到了这个还有 2 -3 "mrg_" Clusters
其中有一些DBID's
,但其编号是 < minClSize
.
我的问题是:处理这个问题的最佳方法是什么"mrg_" Clusters?
:
- 通过其
DBID´s
其"clu_" children
之一? - 将它们视为
a cluster
尽管它们属于minClSize
? - 干脆无视他们?
最佳答案
这是一个分层结果。
您需要将所有子集群包含到一个集群中。
因此,mrg_
集群有一些(可能是 0 个)新对象,加上子集群中的所有这些对象。特别是,它可以有多个子集群(这就是为什么它被称为合并)
关于machine-learning - ELKI 层次聚类 - "mrg_"Cluster 对象,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35596246/