经常有一些 data.frame
包含 20 多个变量,您希望获得(相关结构的)第一个概述。即使在 30 英寸的屏幕上,您也会很快耗尽空间,并且仍然难以掌握信息。是否有任何既定的策略来突出重要的内容?我知道这个问题有点笼统,但我一遍又一遍地想知道,从来没有治愈它的 Elixir 。是的,我听说过summary
。
最佳答案
好吧,我只需要在这里发布我自己的包裹:)
您可以使用 qgraph
将相关矩阵可视化为网络。这会将变量绘制为节点,将相关性绘制为连接节点的边。绿色边缘表示正相关,红色边缘表示负相关。边缘越宽越饱和,绝对相关性越强。
例如(这是帮助页面的第一个示例),以下代码将绘制 240 个变量数据集的相关矩阵。
library("qgraph")
data(big5)
data(big5groups)
qgraph(cor(big5),minimum=0.25,cut=0.4,vsize=2,groups=big5groups,legend=TRUE,borders=FALSE)
title("Big 5 correlations",line=-2,cex.main=2)
您还可以将强相关节点聚集在一起(使用 Fruchterman-Reingold),这样可以非常清晰地显示相关矩阵的结构实际上是什么样的:
还有更多。有关更多示例,请查看我的网站:
http://sachaepskamp.com/?page_id=73
关于r - 什么是获得大相关矩阵或对的良好概述的好策略?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7597216/