我有 > 100 个变量,想了解它们如何相互关联。我想使用 corrplot
包中的 corrplot()
函数来执行此操作。
corrplot()
提供了对显示的变量进行排序的选项,以便最强相关的变量显示在 corrplot 的右上角。必须设置参数 order="hclust"
才能实现此目的:
library(corrplot)
corrplot(cor(df), order="hclust", type="upper") # df = data.frame object
问题:corrplot
将包含所有 > 100 个变量,因此不可读。因此,我正在寻找一种方法来在 corrplot
中显示前 10 个最强的相关变量,然后在另一个 corrplot
中显示前 11-20 个变量,等等。我很感激你的提示和建议。非常感谢。
最佳答案
虽然我晚了一年,但我会把它留在这里,以防其他人需要这个简单而漂亮的解决方案:
从 GitHub 安装 lares
devtools::install_github("laresbernardo/lares")
数据集中具有最高相关性的条形图
library(lares)
corr_cross(data_frame, # dataset
max_pvalue = 0.05, # show only sig. correlations at selected level
top = 10 # display top 10 correlations, any couples of variables )
具有最高相关性的条形图仅关注一个变量(快乐)
corr_var(data_frame, # dataset
happy, # name of variable to focus on
top = 10 # display top 10 correlations )
关于r - 如何在 R 中使用 corrplot() 仅显示前 10 个最强的相关变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51470325/