Javascript:从数组中删除异常值?

标签 javascript statistics

values = [8160,8160,6160,22684,0,0,60720,1380,1380,57128]

如何删除异常值,例如 0、57218、60720 和 22684?

是否有图书馆可以做到这一点?

最佳答案

这完全取决于您对“异常值”什么的解释。一种常见的方法:

  • 高异常值是指超出第三个四分位数 + 1.5 * 四分位数间距 (IQR)
  • 低异常值是指低于第一个四分位数的任何值 - 1.5 * IQR

这也是 Wolfram's Mathworld 描述的方法.

这很容易包含在一个函数中 :) 我试着把下面的内容写清楚;明显的重构机会确实存在。 请注意,使用这种通用方法,您给定的样本不包含异常值

function filterOutliers(someArray) {  

    // Copy the values, rather than operating on references to existing values
    var values = someArray.concat();

    // Then sort
    values.sort( function(a, b) {
            return a - b;
         });

    /* Then find a generous IQR. This is generous because if (values.length / 4) 
     * is not an int, then really you should average the two elements on either 
     * side to find q1.
     */     
    var q1 = values[Math.floor((values.length / 4))];
    // Likewise for q3. 
    var q3 = values[Math.ceil((values.length * (3 / 4)))];
    var iqr = q3 - q1;

    // Then find min and max values
    var maxValue = q3 + iqr*1.5;
    var minValue = q1 - iqr*1.5;

    // Then filter anything beyond or beneath these values.
    var filteredValues = values.filter(function(x) {
        return (x <= maxValue) && (x >= minValue);
    });

    // Then return
    return filteredValues;
}

关于Javascript:从数组中删除异常值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20811131/

相关文章:

javascript - 有没有办法阻止 JavaScript 在我的网站上运行?

javascript - 主干监听集合上的更改事件

testing - 确定随机数测试的测试统计量和分布

statistics - Google云端存储: Where do I get per-bucket statistics

machine-learning - 二元分类 NN 给出了非常低的误报率和非常高的误报率。谁能解释

statistics - Varnishstat -1不显示平均值

javascript - 一个 grunt 任务可以运行其他 grunt 任务吗?

javascript - javascript 在刷新页面之前无法正常工作

php - 将 PHP 日期格式转换为 jQueryUI Datepicker 日期格式

python - Statsmodels.formula.api OLS不显示截距的统计值