R plot data.frame 以获得更有效的数据概览

标签 r plot visualization

在工作中,当我想了解数据集(我使用人寿保险中的投资组合数据)时,我通常会使用 Excel 中的数据透视表来查看例如变量随时间的发展或变量之间的依赖关系。
我记得大学时有一个不错的 R 函数,您可以在其中将数据框的每一列与其他每一列进行绘制,如下所示:

enter image description here

对于 issue.age 和 duration 之间的依赖关系,这个图实际上很有趣,因为您可以清楚地看到高问题年龄伴随着较短的保单期限(因为每个保单都有一个最大年龄)。然而涉及发行年份的地块iss.year不那么“视觉”。事实上,你看不到他们的任何东西。我想一眼看一下发行年龄的分布是否在不同的发行年中发生了变化,例如

enter image description here

您可以立即看到,从 2014 年到 2016 年,新发行保单的平均年龄一直在增加。

我不想编写需要为我输入的每个数据集定制的代码,因为这样我也可以在 Excel 中手动更快地完成。

所以我的问题是,是否有一种简单的方法可以使用比标准 plot(data.frame) 更灵活的图表类型来绘制矩阵的每一列与其他每一列?

最佳答案

ggpairs()来自 GGally library 的函数.它具有许多可视化所有不同类型列的能力,并提供了对可视化内容的大量控制。

例如,这里是来自上面链接的小插图的片段:

data(tips, package = "reshape")
ggpairs(tips)

ggpair example visualization

关于R plot data.frame 以获得更有效的数据概览,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41381296/

相关文章:

r - read.csv,第一行的标题,跳过第二行

R 交互和批处理模式以及帮助浏览器

r - R中的多维(2D)函数图

python - 如何在 python 中使用 matplotlib 绘制叠加条形图?

javascript - D3.js 未使用所有数据点

r - R 中的 image.plot 不显示色阶边缘的色阶值

r - 来自数据框中 3 个不同变量的日期

c++ - 使用 Cimg 在 C++ 中绘制 vector

javascript - D3 IE8 兼容性?

d3.js - 数据可视化初学者 : Learn processing, d3.js 还是其他先?