java - 相同的代码块在java中的运行时间是不同的。这是为什么?

标签 java performance

我有以下代码。我只是想检查代码块的运行时间。我错误地再次复制并粘贴了相同的代码并得到了一个有趣的结果。尽管代码块相同,但运行时间不同。还有code block 1比其他人花费更多的时间。如果我切换代码块(say i move the code blocks 4 to the top)那么代码块 4 将比其他代码块花费更多的时间。

我在代码块中使用了两种不同类型的数组来检查它是否依赖于此。结果是一样的。如果代码块具有相同类型的数组,则最顶层的代码块将花费更多时间。请参阅下面的代码和给出的输出。

public class ABBYtest {

public static void main(String[] args) {
    long startTime;
    long endTime;

    //code block 1
    startTime = System.nanoTime();
    Long a[] = new Long[10];
    for (int i = 0; i < a.length; i++) {
        a[i] = 12l;
    }
    Arrays.sort(a);
    endTime = System.nanoTime();
    System.out.println("code block (has Long array) 1 = " + (endTime - startTime));

    //code block 6
    startTime = System.nanoTime();
    Long aa[] = new Long[10];
    for (int i = 0; i < aa.length; i++) {
        aa[i] = 12l;
    }
    Arrays.sort(aa);
    endTime = System.nanoTime();
    System.out.println("code block (has Long array) 6 = " + (endTime - startTime));


    //code block 7
    startTime = System.nanoTime();
    Long aaa[] = new Long[10];
    for (int i = 0; i < aaa.length; i++) {
        aaa[i] = 12l;
    }
    Arrays.sort(aaa);
    endTime = System.nanoTime();
    System.out.println("code block (has Long array) 7 = " + (endTime - startTime));

    //code block 2
    startTime = System.nanoTime();
    long c[] = new long[10];
    for (int i = 0; i < c.length; i++) {
        c[i] = 12l;
    }
    Arrays.sort(c);
    endTime = System.nanoTime();
    System.out.println("code block (has long array) 2 = " + (endTime - startTime));

    //code block 3
    startTime = System.nanoTime();
    long d[] = new long[10];
    for (int i = 0; i < d.length; i++) {
        d[i] = 12l;
    }
    Arrays.sort(d);
    endTime = System.nanoTime();
    System.out.println("code block (has long array) 3 = " + (endTime - startTime));

    //code block 4
    startTime = System.nanoTime();
    long b[] = new long[10];
    for (int i = 0; i < b.length; i++) {
        b[i] = 12l;
    }
    Arrays.sort(b);
    endTime = System.nanoTime();
    System.out.println("code block (has long array) 4 = " + (endTime - startTime));

    //code block 5
    startTime = System.nanoTime();
    Long e[] = new Long[10];
    for (int i = 0; i < e.length; i++) {
        e[i] = 12l;
    }
    Arrays.sort(e);
    endTime = System.nanoTime();
    System.out.println("code block (has Long array) 5 = " + (endTime - startTime));


}
}

运行时间:

code block (has Long array) 1 = 802565

code block (has Long array) 6 = 6158

code block (has Long array) 7 = 4619

code block (has long array) 2 = 171906

code block (has long array) 3 = 4105

code block (has long array) 4 = 3079

code block (has Long array) 5 = 8210

我们可以看到第一个代码块包含 Long array比其他包含 Long arrays 的内容需要更多时间。对于包含 long array 的第一个代码块也是如此。 。

谁能解释一下这种行为。或者我在这里做错了什么??

最佳答案

基准测试错误。错误的非详尽列表:

  • 无需预热:单次测量几乎总是错误的;
  • 在单个方法中混合多个代码路径:我们可能开始使用仅适用于方法中第一个循环的执行数据来编译该方法;
  • 来源是可预测的:如果循环编译,我们实际上可以预测结果;
  • 结果消除了死代码:如果循环编译,我们可以将其丢弃

这就是你如何正确地使用 jmh 来做到这一点:

@OutputTimeUnit(TimeUnit.NANOSECONDS)
@BenchmarkMode(Mode.AverageTime)
@Warmup(iterations = 3, time = 1)
@Measurement(iterations = 3, time = 1)
@Fork(10)
@State(Scope.Thread)
public class Longs {

    public static final int COUNT = 10;

    private Long[] refLongs;
    private long[] primLongs;

    /*
     * Implementation notes:
     *   - copying the array from the field keeps the constant
     *     optimizations away, but we implicitly counting the
     *     costs of arraycopy() in;
     *   - two additional baseline experiments quantify the
     *     scale of arraycopy effects (note you can't directly
     *     subtract the baseline scores from the tests, because
     *     the code is mixed together;
     *   - the resulting arrays are always fed back into JMH
     *     to prevent dead-code elimination
     */

    @Setup
    public void setup() {
        primLongs = new long[COUNT];
        for (int i = 0; i < COUNT; i++) {
            primLongs[i] = 12l;
        }

        refLongs = new Long[COUNT];
        for (int i = 0; i < COUNT; i++) {
            refLongs[i] = 12l;
        }
    }

    @GenerateMicroBenchmark
    public long[] prim_baseline() {
        long[] d = new long[COUNT];
        System.arraycopy(primLongs, 0, d, 0, COUNT);
        return d;
    }

    @GenerateMicroBenchmark
    public long[] prim_sort() {
        long[] d = new long[COUNT];
        System.arraycopy(primLongs, 0, d, 0, COUNT);
        Arrays.sort(d);
        return d;
    }

    @GenerateMicroBenchmark
    public Long[] ref_baseline() {
        Long[] d = new Long[COUNT];
        System.arraycopy(refLongs, 0, d, 0, COUNT);
        return d;
    }

    @GenerateMicroBenchmark
    public Long[] ref_sort() {
        Long[] d = new Long[COUNT];
        System.arraycopy(refLongs, 0, d, 0, COUNT);
        Arrays.sort(d);
        return d;
    }

}

...这会产生:

Benchmark                   Mode   Samples         Mean   Mean error    Units
o.s.Longs.prim_baseline     avgt        30       19.604        0.327    ns/op
o.s.Longs.prim_sort         avgt        30       51.217        1.873    ns/op
o.s.Longs.ref_baseline      avgt        30       16.935        0.087    ns/op
o.s.Longs.ref_sort          avgt        30       25.199        0.430    ns/op

此时您可能会开始想知道为什么排序 Long[] 和排序 long[] 需要不同的时间。答案在于 Array.sort() 重载:OpenJDK 通过不同的算法对基元和引用数组进行排序(使用 TimSort 的引用,使用双枢轴快速排序的基元)。以下是使用 -Djava.util.Arrays.useLegacyMergeSort=true 选择另一个算法的亮点,该算法回退到合并排序以供引用:

Benchmark                   Mode   Samples         Mean   Mean error    Units
o.s.Longs.prim_baseline     avgt        30       19.675        0.291    ns/op
o.s.Longs.prim_sort         avgt        30       50.882        1.550    ns/op
o.s.Longs.ref_baseline      avgt        30       16.742        0.089    ns/op
o.s.Longs.ref_sort          avgt        30       64.207        1.047    ns/op

希望这有助于解释其中的差异。

上面的解释仅仅触及了排序性能的表面。当呈现不同的源数据(包括可用的预排序子序列、它们的模式和游程长度、数据本身的大小)时,性能有很大不同。

关于java - 相同的代码块在java中的运行时间是不同的。这是为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20811061/

相关文章:

php - 一个查找表,存储在 MySQL 或 PHP 中

javascript - 使用大数组进行反向地理编码是最快的方法吗? - JavaScript 和性能

java - 使用 JGit 获取存储库的所有标签

java - 如何将 Spring Ws 中的 Soap 请求消息发送到接受 Soap 请求消息的服务器?

java - 需要时一一获取集合元素

mysql - 为什么使用mysqldump导入数据后会出现固定的block size write?

javascript - 使用函数式 Javascript 与 "procedural"的性能影响

java - ClassNotFoundException : org. Glassfish . Jersey .servlet.ServletContainer

java - 在 java 中使用 Apache-Spark 在 Dataset<Row> 中用空字符串填充 null 值

python - Numpy 根据其值对数组中的元素求和