r - 忽略 ggplot2 boxplot + faceting + "free"选项中的异常值

标签 r ggplot2 facet boxplot outliers

如何调整 Y 轴以忽略异常值,例如 this post ,但在一个更具挑战性的情况下,我有 4 个箱线图和一个“自由分面”布局?

p <- ggplot(molten.DF,aes(x=class,y=SOC,fill=class)) + geom_boxplot() + facet_grid(layer~.,scales="free",space="free")



正如您在我的图中所看到的,考虑到 Y 轴范围内的异常值会使框更难阅读。如果结果中仍然可以看到一些异常值并不重要,但我想真正关注这些框!

boxplot with free scale, all outliers are (unfortuately) visibles

最佳答案

这显然取决于您认为的异常值。如果你可以计算它,你可以设置你的ylim在这个值下,让这些点离开图表。

例如,如果您假设上限和下限是 Q3 + 1.5 IQR 和 Q1 - 1.5 IQR,这是箱线图通常计算其异常值限制的方式,您将有:

upper.fence <- quantile(x)[4] + 1.5*IQR(x)
lower.fence <- quantile(x)[2] - 1.5*IQR(x)

然后您可以将这些限制用作 y值范围:
my.ggplot + coord_cartesian(ylim=c(lower.fence, upper.fence))

您用于获取上限和下限的程序可以更改,但限制的使用是相同的。

关于r - 忽略 ggplot2 boxplot + faceting + "free"选项中的异常值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10618529/

相关文章:

r - 使用 "{{"运算符通过环境变量隧道数据变量

r - ggplot2 中的绘图树

r - 如果使用scale_x_datetime,时间序列图会偏移2小时

lucene - 从Lucene查询中获取术语计数

java - Solr 3.1 分面范围查询

菱形 igraph 节点

r - 将文件导出到R中的相对路径

r - ggplot2 颜色条具有不连续跳跃的倾斜数据

r - 调整 facet_grid 中 One Line 的线型

r - 预测 SPC(统计过程控制)