r - 如何在 R 中使用 corrplot() 仅显示前 10 个最强的相关变量?

标签 r correlation r-corrplot

我有 > 100 个变量,想了解它们如何相互关联。我想使用 corrplot 包中的 corrplot() 函数来执行此操作。

corrplot() 提供了对显示的变量进行排序的选项,以便最强相关的变量显示在 corrplot 的右上角。必须设置参数 order="hclust" 才能实现此目的:

library(corrplot)
corrplot(cor(df), order="hclust", type="upper") # df = data.frame object

问题:corrplot 将包含所有 > 100 个变量,因此不可读。因此,我正在寻找一种方法来在 corrplot 中显示前 10 个最强的相关变量,然后在另一个 corrplot 中显示前 11-20 个变量,等等。我很感激你的提示和建议。非常感谢。

最佳答案

虽然我晚了一年,但我会把它留在这里,以防其他人需要这个简单而漂亮的解决方案:

从 GitHub 安装 lares

devtools::install_github("laresbernardo/lares")

数据集中具有最高相关性的条形图

library(lares) 
corr_cross(data_frame, # dataset
           max_pvalue = 0.05, # show only sig. correlations at selected level
           top = 10 # display top 10 correlations, any couples of variables  )

具有最高相关性的条形图仅关注一个变量(快乐)

corr_var(data_frame, # dataset
         happy, # name of variable to focus on
         top = 10 # display top 10 correlations )

关于r - 如何在 R 中使用 corrplot() 仅显示前 10 个最强的相关变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51470325/

相关文章:

r - 使用满足条件的同一组中的第一个下一行设置列值

r - 传递对象以返回错误

r - 如何将一个变量与R上的所有其他变量相关

r - hclust 之后 corrplot 中的标签顺序

r - R中的聚合和加权平均值

r - Knitr 生成非常大的 html 文件

python - 正弦波自相关不正确

python - 两个二值图像之间的相关性

r - 如何在 corrplot() 中以数字方式可视化置信区间?

r - 在 ggpairs (GGally) 中操作轴标题