我尝试在官方网站 (mouse.csv) 上提供的示例数据集上运行 COPAC ELKI 实现,但我得到一个 NullPointerException,这让我认为我忽略了一些细节(我感到羞耻)。
异常(exception)情况如下:
Task failed java.lang.NullPointerException at de.lmu.ifi.dbs.elki.database.ids.integer.DoubleDistanceIntegerDBIDPair.compareByDistance(Unknown Source) at de.lmu.ifi.dbs.elki.distance.distanceresultlist.AbstractKNNHeap$Comp.compare(Unknown Source) at de.lmu.ifi.dbs.elki.distance.distanceresultlist.AbstractKNNHeap$Comp.compare(Unknown Source) at de.lmu.ifi.dbs.elki.utilities.datastructures.heap.TopBoundedHeap.add(Unknown Source) at de.lmu.ifi.dbs.elki.database.query.knn.LinearScanRawDoubleDistanceKNNQuery.getKNNForObjectBenchmarked(Unknown Source) at de.lmu.ifi.dbs.elki.database.query.knn.LinearScanRawDoubleDistanceKNNQuery.getKNNForObject(Unknown Source) at de.lmu.ifi.dbs.elki.database.query.knn.LinearScanRawDoubleDistanceKNNQuery.getKNNForDBID(Unknown Source) at de.lmu.ifi.dbs.elki.index.preprocessed.localpca.KNNQueryFilteredPCAIndex.objectsForPCA(Unknown Source) at de.lmu.ifi.dbs.elki.index.preprocessed.localpca.KNNQueryFilteredPCAIndex.objectsForPCA(Unknown Source) at de.lmu.ifi.dbs.elki.index.preprocessed.localpca.AbstractFilteredPCAIndex.preprocess(Unknown Source) at de.lmu.ifi.dbs.elki.index.preprocessed.localpca.AbstractFilteredPCAIndex.getLocalProjection(Unknown Source) at de.lmu.ifi.dbs.elki.index.preprocessed.localpca.AbstractFilteredPCAIndex.getLocalProjection(Unknown Source) at de.lmu.ifi.dbs.elki.algorithm.clustering.correlation.COPAC.run(Unknown Source) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) at java.lang.reflect.Method.invoke(Method.java:616) at de.lmu.ifi.dbs.elki.algorithm.AbstractAlgorithm.run(Unknown Source) at de.lmu.ifi.dbs.elki.workflow.AlgorithmStep.runAlgorithms(Unknown Source) at [...]
这是我使用的参数设置:
-dbc.in [路径省略]/mouse.csv
-算法 聚类.相关.COPAC
-copac.预处理器 localpca.KNNQueryFilteredPCAIndex
-copac.partitionAlgorithm gdbscan.GeneralizedDBSCAN
-dbscan.epsilon 0.00400000
-dbscan.minpts 3
谁能给我一些信息?
最佳答案
您必须为 kNN Local PCA 指定k
参数:
-localpca.k 10
在上一个 ELKI 版本中有一个小错误,参数被错误地标记为可选。它不是可选的。请注意,k 应明显大于数据维数,以提供稳定的 PCA 结果。
请注意,在鼠标示例等低维数据集上使用 COPAC 没有意义。
关于algorithm - ELKI COPAC 实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15363851/