r - 在 R 中绘制 dbscan 的结果

标签 r visualization cluster-analysis data-visualization dbscan

非常感谢您的意见、建议或解决方案,谢谢。

我正在使用 fpc R 中的包对一些非常密集的数据(范围 -3、6 之间的 3 组 40,000 点)进行 dbscan 分析。

我找到了一些集群,我只需要绘制重要的集群。问题是我有一个集群(第一个),其中包含大约 39,000 个点。我需要绘制除这个集群之外的所有其他集群。
dbscan()创建一个特殊的数据类型来存储所有这些集群数据。它不像数据框那样被索引(但也许有一种方法来表示它?)。

我可以使用基本的 plot() 绘制 dbscan 类型的图形。称呼。但是,就像我说的,这将绘制不相关的 39,000 点。

tl;博士:
如何仅绘制 dbscan 的特定集群数据类型?

最佳答案

如果您查看帮助页面 ( ?dbscan ),它会像所有其他页面一样组织成标记为“描述”、“用法”、“参数”、“详细信息”和“值”的部分。值部分描述了函数 dbscan返回。在这种情况下,它只是一个包含几个组件的列表(标准 R 数据类型)。
cluster组件只是一个整数向量,其长度等于数据中的行数,指示每个观察值属于哪个集群。因此,您可以使用此向量对数据进行子集化,以仅提取您想要的那些集群,然后仅绘制这些数据点。

例如,如果我们使用帮助页面中的第一个示例:

set.seed(665544)
n <- 600
x <- cbind(runif(10, 0, 10)+rnorm(n, sd=0.2), runif(10, 0, 10)+rnorm(n,
    sd=0.2))
ds <- dbscan(x, 0.2)

然后我们可以使用结果,ds仅绘制集群 1-3 中的点:
#Plot only clusters 1, 2 and 3
plot(x[ds$cluster %in% 1:3,])

关于r - 在 R 中绘制 dbscan 的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6826320/

相关文章:

python - 分层树的视觉替代方案 : (((A, B),(C,D)),E)?

coordinates - 3d 坐标上的 DBSCAN 找不到簇

r - 使用 ggplot2 进行逻辑回归 + 直方图

java - Graph Zoom jScrollPane 和 Visualization Viewer 依赖项

r - 计算r中两个日期之间的天数

python - 保存到 eps 的 Seaborn 图不显示网格

algorithm - 使用 BIC 的 K 均值聚类中的最佳聚类数,(MATLAB)

algorithm - 完整的链路聚类

r - 使用 dplyr 和 lubridate 的 R 中两个日期之间的天数差异?

r - 如何根据另一列突出显示一列中的连续字符串