在工作中,当我想了解数据集(我使用人寿保险中的投资组合数据)时,我通常会使用 Excel 中的数据透视表来查看例如变量随时间的发展或变量之间的依赖关系。
我记得大学时有一个不错的 R 函数,您可以在其中将数据框的每一列与其他每一列进行绘制,如下所示:
对于 issue.age 和 duration 之间的依赖关系,这个图实际上很有趣,因为您可以清楚地看到高问题年龄伴随着较短的保单期限(因为每个保单都有一个最大年龄)。然而涉及发行年份的地块iss.year
不那么“视觉”。事实上,你看不到他们的任何东西。我想一眼看一下发行年龄的分布是否在不同的发行年中发生了变化,例如
您可以立即看到,从 2014 年到 2016 年,新发行保单的平均年龄一直在增加。
我不想编写需要为我输入的每个数据集定制的代码,因为这样我也可以在 Excel 中手动更快地完成。
所以我的问题是,是否有一种简单的方法可以使用比标准 plot(data.frame)
更灵活的图表类型来绘制矩阵的每一列与其他每一列?
最佳答案
ggpairs()
来自 GGally
library 的函数.它具有许多可视化所有不同类型列的能力,并提供了对可视化内容的大量控制。
例如,这里是来自上面链接的小插图的片段:
data(tips, package = "reshape")
ggpairs(tips)
关于R plot data.frame 以获得更有效的数据概览,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41381296/