r - R中所有百分位数的变量具有离群值的箱形图

标签 r ggplot2 dplyr gplots

在我的数据集中

comp=structure(list(MYCT = c(125L, 29L, 29L, 29L, 29L, 26L, 23L, 23L, 
23L, 23L, 400L, 400L), MMIN = c(256L, 8000L, 8000L, 8000L, 8000L, 
8000L, 16000L, 16000L, 16000L, 32000L, 1000L, 512L), MMAX = c(6000L, 
32000L, 32000L, 32000L, 16000L, 32000L, 32000L, 32000L, 64000L, 
64000L, 3000L, 3500L), CACH = c(256L, 32L, 32L, 32L, 32L, 64L, 
64L, 64L, 64L, 128L, 0L, 4L), CHMIN = c(16L, 8L, 8L, 8L, 8L, 
8L, 16L, 16L, 16L, 32L, 1L, 1L), CHMAX = c(128L, 32L, 32L, 32L, 
16L, 32L, 32L, 32L, 32L, 64L, 2L, 6L), PRP = c(198L, 269L, 220L, 
172L, 132L, 318L, 367L, 489L, 636L, 1144L, 38L, 40L), ERP = c(199L, 
253L, 253L, 253L, 132L, 290L, 381L, 381L, 749L, 1238L, 23L, 24L
)), .Names = c("MYCT", "MMIN", "MMAX", "CACH", "CHMIN", "CHMAX", 
"PRP", "ERP"), class = "data.frame", row.names = c(NA, -12L))

我有8个变量。我需要获取boxplot,其中离群值表示为红色圆圈,并且具有带百分位数的比例。
现在我简单地写
boxplot(comp$MMIN)

但是这个情节没有离群值。
我希望这样的事情
expected plot

例如,在这张照片中,我看到两个异常值,高于75个百分点。
这个图我需要每个8个变量。
如何执行呢?

最佳答案

绝不是一个可行的解决方案,但这应该可以助您一臂之力。

off=0.55
ggplot() + 
    geom_boxplot(data=comp,
        aes(x="",y=MMIN),
        # custom outliers
        outlier.colour="red",
        outlier.fill="red",
        outlier.size=3
    ) +
    geom_line(aes(x=c(off,off),y=c(5000,20000))) +
    geom_text(aes(x=c(off,off),y=c(5000,20000),label=c("needs to", "be calculated")))

关于r - R中所有百分位数的变量具有离群值的箱形图,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50566778/

相关文章:

r - 按数据框行计算小于 x 的值数

r - 如何将 lapply 中的新值分配给列表中数据帧中的新列

r - 提取值出现在多列中的任何一列的行

R(和 dplyr?) - 按组从数据帧中采样,最大样本量为 n

r - 18 位时间戳转常规日期格式

r - 计算R中两个数字的小数点后有多少位一致

r - 如何从OSRM解码编码的折线并绘制路线几何图形?

r - 将多个图例与拼凑对齐

r - ggsave 以批处理模式自动保存所有完成的绘图

r - 数据集中每组的样本数不同