r - 解释 hclust/heatmap.2 中 'cutree' 的结果

标签 r cluster-analysis heatmap hclust gplots

我有以下代码来执行层次聚类和绘图它们在热图中。

set.seed(538)
# generate data
y <- matrix(rnorm(50), 10, 5, dimnames=list(paste("g", 1:10, sep=""),
paste("t", 1:5, sep="")))
# the actual data is much larger that the above

# perform hiearchical clustering and plot heatmap
test <- heatmap.2(y)

我想要做的是打印每个层次结构中的集群成员情节中的。我不确定什么是最好的方法。

我尝试过这个:

cutree(as.hclust(test$rowDendrogram), 1:dim(y)[1])

但是在解释结果时遇到问题。矩阵中每个值的含义是什么？例如 g9-9=8 。 8在这里意味着什么？

    1 2 3 4 5 6 7 8 9 10
g1  1 1 1 1 1 1 1 1 1  1
g2  1 2 2 2 2 2 2 2 2  2
g3  1 2 2 3 3 3 3 3 3  3
g4  1 2 2 2 2 2 2 2 2  4
g5  1 1 1 1 1 1 1 4 4  5
g6  1 2 3 4 4 4 4 5 5  6
g7  1 2 2 2 2 5 5 6 6  7
g8  1 2 3 4 5 6 6 7 7  8
g9  1 2 3 4 4 4 7 8 8  9
g10 1 2 3 4 5 6 6 7 9 10

我们将非常感谢您的专家建议。

最佳答案

列j告诉您如果您想要精确的j组，您的g应该如何分组。

列 1 和 10 不是很有用，但也许列 2 是一个很好的例子。它告诉您，如果您想要恰好两个组，那么它们将是:

group1: {g1, g5}
group2: {g2, g3, g4, g6, g7, g8, g9, g10}

关于r - 解释 hclust/heatmap.2 中 'cutree' 的结果，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18370683/

上一篇：variables - SAS - 比较两个数据集中的两个变量

下一篇：console2 - 无法使 -r 参数正常工作

相关文章：

r - 使用 RSelenium 获取元素文本

r - 计算数字向量的变化率

algorithm - 如何使用共享元素对列表进行聚类

python - 如何对在 NetworkX 中创建的图 g 进行聚类？

r - 使用 R 将四次核热图转换为大多边形

python - 在 clustermap 上为等于零的值设置特定颜色

pandas - 工作日和一天中不同时间的平均参与度热图

读取存储在 HDF5 中的数据帧

r - R使用str_extract(stringr)导出 “_”之间的字符串

python - 查找包含给定单词的最多提及次数的 HTML 元素