r - 使方框连接更清晰易懂

标签 r plot graph

我想检查数据集中所有变量对之间的线性关系。因为我有 39 个变量,所以散点图不是很有帮助,所以我决定选择一个随机样本(20 个变量)来检查它,但图表仍然太大而无法解释。我使用以下代码

require("pairsD3")
sample_data <- data[ ,sample(ncol(data), 20)]

pairs(sample_data, pch=19)

并得到以下结果 enter image description here

enter image description here

有什么方法可以使项目符号变小,以便我可以查看是否存在线性或其他检查线性的方法?先感谢您!

最佳答案

您可能会更好地尝试直接获取线性关系。这就是相关系数的用途。有一些很好的工具可以可视化相关矩阵,以便您可以快速扫描关系。我喜欢corrplot。由于您没有提供任何数据,我将用 Glass 数据进行说明。

library(corrplot)
library(mlbench)    ## for Glass data
data(Glass)

corrplot(cor(Glass[,1:9]))

corrplot

它只有 9 个变量,但即使有 39 个,您也应该会发现它是可读的。 你可以看看这个,立即发现最强的关系是在 RI 和 Ca 之间。 RI 和 Si 之间存在相当强的负相关关系。一旦您知道哪些变量是相关的,您就可以仅针对相关变量绘制散点图,并有更多空间来查看结果。

plot(Glass[ ,c(1,5,7)], pch=16)

Scatterplot of correlated variables

关于r - 使方框连接更清晰易懂,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59590847/

相关文章:

r - 在gganimate中以不同的速度显示不同的时间元素

python - 从 txt 文件创建 heatmap2d

algorithm - 任意点网格的拓扑排序?

python - plt.show() 不显示数据,而是将其保留用于下一个图(spyder)

javascript - 如何在 D3 中标记节点并创建箭头?

c# - 如何绘制平滑/圆角/曲线图? (C#)

r - 如何使用mlogit模型建立AIC选型表

r - 从版本 14 之前的 Stata 文件将 .dta 文件读入 R 时如何处理编码?

r - 在 r 中,使用 tidymodels : Warning message: "All models failed in [fit_resamples()]. See the ` . 注释`列 ."internal: Error: In metric: ` roc_auc`

r - 加载 RData、Package 时有 Shiny 的进度条?