machine-learning - Eps、DBSCAN 中哪些点算数

标签 machine-learning cluster-computing cluster-analysis dbscan

在 DBSCAN 中,如果我们有 minPoints=3 并且我们想确定一个点是否是核心点,那么您是否将该点本身计入 Eps 中,还是需要在 Eps 中包含其他 3 个点?

最佳答案

DBSCAN 是一种具有数据库上下文的算法。

为了获得良好的性能,您需要一个可以使用索引加速此类查询的数据库 - 这会将运行时间从 O(n^2) 减少到 O(n log n).

如果您向数据库发送范围查询,它将返回该区域内的所有对象,包括查询点。您必须手动从结果中删除查询点。

而且从逻辑的角度来看:这是一个密度度量。为什么密度估计必须排除查询对象?它是数据集的一部分,它应该像任何其他对象一样对密度做出贡献!

我看不出有任何理由应该从每个查询的数据集中删除查询点。

关于machine-learning - Eps、DBSCAN 中哪些点算数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23606743/

相关文章:

machine-learning - 二进制交叉熵损失在自动编码器上如何工作?

r - 向集群添加标签

machine-learning - 使用机器学习绘制植物 map

tensorflow - 是否有任何解决方法可以沿着可变长度的维度取消堆叠张量?

java - 锁定 WebLogic 集群中的 Java 对象或 Java 方法

MySQL Cluster 7.4.15 - Ndb_Restore 由于孤立片段而失败

tomcat节点之间的 session 复制

python - 在python中获取sklearn中的簇大小

python - scikit 学习在一定数量的数据上崩溃

python - 对流水线中的同一个估计器使用不同的特征