machine-learning - DBSCAN 的距离函数

标签 machine-learning cluster-analysis unsupervised-learning

我想使用聚类算法来找到大有向图的聚类,并且我也想从该图中消除噪声。因此,我正在考虑使用DBSCAN方法,因为我发现我们可以为算法提供一个距离函数来确定两个不同节点之间的距离/相似度

我的问题是,如何定义一个距离函数,该距离函数可以增加两个节点之间的相似度(以跳数为单位),并在节点被隔离时减少

我没有坐标或节点属性,因此无法使用它们。我只有图的拓扑。

预期的输出将是这样的:

enter image description here

我真的很担心解决方案的复杂性。如何以线性复杂度近似聚类...

最佳答案

显而易见的事情有什么问题吗?

距离(a,b) = 最短路径的长度,如果没有,则为无穷大。

您可能应该考虑方向,因此 a0 到 a3 就是 1。

关于machine-learning - DBSCAN 的距离函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50042832/

相关文章:

python - 如何将某些条目的列数不同的自定义数据集表示并加载到 sci-kit 学习中

logging - 服务器日志数据的机器学习

python - 使用 keras 自定义层时构建错误

machine-learning - word2vec 对于监督学习有意义吗?

machine-learning - 时间序列数据中的模式检测

machine-learning - Keras 中随时间变化的最大池化

machine-learning - 在 TensorFlow 中存储摘要编写器的多次运行的建议做法是什么?

graph - 聚类图可视化技术

opencv - 如何将 K 均值应用于图像的蒙版而不是整个图像

python - PySpark:AttributeError: 'PipelineModel'对象没有属性 'clusterCenters'