java - Apache Commons Math 2.2 百分位数错误?

标签 java algorithm math apache-commons percentile

我不是 100% 确定这是一个错误还是我没有做正确的事情但是如果你给 Percentile 大量的数据是一致的相同值(见下面的代码)评估方法需要一个非常很久。如果您给 Percentile,则随机值的评估时间会大大缩短。

如下所述,Median 是 Percentile 的子类。

Percentile java doc

private void testOne(){
  int size = 200000;
  int sameValue = 100;
  List<Double> list = new ArrayList<Double>();

  for (int i = 0; i < size; i++)
  {
    list.add((double)sameValue);
  }
  Median m = new Median();
  m.setData(ArrayUtils.toPrimitive(list.toArray(new Double[0])));

  long start = System.currentTimeMillis();
  System.out.println("Start:"+ start);

  double result = m.evaluate();

  System.out.println("Result:" + result);
  System.out.println("Time:"+ (System.currentTimeMillis()- start));
}


private void testTwo(){
  int size = 200000;
  List<Double> list = new ArrayList<Double>();

  Random r = new Random();

  for (int i = 0; i < size; i++)
  {
    list.add(r.nextDouble() * 100.0);
  }
  Median m = new Median();
  m.setData(ArrayUtils.toPrimitive(list.toArray(new Double[0])));

  long start = System.currentTimeMillis();
  System.out.println("Start:"+ start);

  double result = m.evaluate();

  System.out.println("Result:" + result);
  System.out.println("Time:"+ (System.currentTimeMillis()- start));
}

最佳答案

这是一个 known issue在版本 2.0 和 2.1 之间,并已针对 version 3.1 进行了修复.

2.0 版确实涉及对数据进行排序,但在 2.1 中它们似乎已切换到 selection algorithm。 .然而,a bug在他们的实现中,导致具有许多相同值的数据出现一些不良行为。基本上他们使用 >= 和 <= 而不是 > 和 <.

关于java - Apache Commons Math 2.2 百分位数错误?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5532196/

相关文章:

java - Java SecurityManager下的SpringBoot webapp在授予AllPermission时抛出异常

algorithm - C++ 动态规划 : error in traversing the grid

vb.net - 优化除法/指数计算

javascript - 如何根据对数要求创建尺寸公式

java - 如何使用 ConstraintLayout 创建此布局

java - 尝试运行 OpenCV 教程 2 - 混合处理演示

algorithm - 您究竟如何计算快速傅里叶变换?

regex - 在二进制文件中查找代码片段

objective-c - 正态分布函数

java - 套接字批量读取返回一个零数组