我想检查数据集中所有变量对之间的线性关系。因为我有 39 个变量,所以散点图不是很有帮助,所以我决定选择一个随机样本(20 个变量)来检查它,但图表仍然太大而无法解释。我使用以下代码
require("pairsD3")
sample_data <- data[ ,sample(ncol(data), 20)]
pairs(sample_data, pch=19)
并得到以下结果 enter image description here
有什么方法可以使项目符号变小,以便我可以查看是否存在线性或其他检查线性的方法?先感谢您!
最佳答案
您可能会更好地尝试直接获取线性关系。这就是相关系数的用途。有一些很好的工具可以可视化相关矩阵,以便您可以快速扫描关系。我喜欢corrplot。由于您没有提供任何数据,我将用 Glass 数据进行说明。
library(corrplot)
library(mlbench) ## for Glass data
data(Glass)
corrplot(cor(Glass[,1:9]))
它只有 9 个变量,但即使有 39 个,您也应该会发现它是可读的。 你可以看看这个,立即发现最强的关系是在 RI 和 Ca 之间。 RI 和 Si 之间存在相当强的负相关关系。一旦您知道哪些变量是相关的,您就可以仅针对相关变量绘制散点图,并有更多空间来查看结果。
plot(Glass[ ,c(1,5,7)], pch=16)
关于r - 使方框连接更清晰易懂,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59590847/