我想分别用这些百分位值替换相对较大的 R 数据集中的所有值,这些值的值高于第 95 个百分位且低于第 5 个百分位。我的目标是避免简单地从数据中完全裁剪掉这些异常值。
任何建议将不胜感激,我在其他地方找不到任何有关如何执行此操作的信息。
最佳答案
这样就可以了。
fun <- function(x){
quantiles <- quantile( x, c(.05, .95 ) )
x[ x < quantiles[1] ] <- quantiles[1]
x[ x > quantiles[2] ] <- quantiles[2]
x
}
fun( yourdata )
关于r - 如何用 R 中的第 5 个和第 95 个百分位值替换异常值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13339685/