java - 为什么在 Java8 中将最小粒度定义为 8192 以便从并行排序切换到 Arrays.sort 而不管数据类型

标签 java arrays sorting java-8

我正在研究 Java 8 中引入的并行排序概念。 根据 doc .

If the length of the specified array is less than the minimum granularity, then it is sorted using the appropriate Arrays.sort method.

然而,规范并未指定此最低限制。
当我在 java.util.Arrays 中查找代码时,它被定义为

private static final int MIN_ARRAY_SORT_GRAN = 1 << 13; 

即数组中的 8192 个值

根据提供的解释 here . 我理解为什么该值被硬编码为 8192

It was designed keeping the current CPU architecture in mind.
With the -XX:+UseCompressedOops option being enabled by default, any system with less than 32GB RAM would be using 32bit(4bytes) pointers. Now, with a L1 Cache size of 32KB for data portion, we can pass 32KB/4Bytes = 8KB of data at once to CPU for computation. That's equivalent to 8192 bytes of data being processed at once.

因此对于一个正在对字节数组进行排序的函数 parallelSort(byte[]) 这是有道理的。您可以将最小并行排序限制保持为 8192 个值(对于字节数组,每个值 = 1 个字节)。

但是如果你考虑public static void parallelSort(int[] a)

一个整型变量是 4 字节(32 位)。所以理想情况下,在 8192 字节中,我们可以一次在 CPU 缓存中存储 8192/4 = 2048 个数字。 因此本例中的最小粒度假设为 2048。

为什么 Java 中的所有 parallelSort 函数(例如 byte[]、int[]、long[] 等)都使用 8192 作为默认最小值。执行并行排序需要多少个值?
它不应该根据传递给 parallelSort 函数的类型而变化吗?

最佳答案

首先,您似乎误读了链接的解释。 L1 数据缓存为 32Kb,因此对于 int[] 它非常适合:32768/4=8192 int 可以放入 L1 缓存中。

其次,我认为给出的解释不正确。它专注于指针,所以它主要说的是对象数组的排序,但是当你比较对象数组中的数据时,你总是需要解引用这些指针来访问真正的数据。如果您的对象具有非原始字段,您将不得不进一步取消引用它们。例如,如果您对字符串数组进行排序,您不仅要访问数组本身,还要访问 String 对象和存储在其中的 char[] 数组。所有这些都需要许多额外的缓存行。

我在 review thread 中没有找到关于这个特定值的任何明确解释对于这个改变。以前是 256,然后作为 JDK-8014076 的一部分更改为 8192更新。我认为它只是在一些合理的测试套件上显示出最佳性能。为不同的情况保持单独的阈值会增加更多的复杂性。可能测试表明它没有返回。请注意,对于 Object[] 数组来说,理想的阈值是不可能的,因为比较函数是用户指定的,并且可能具有任意复杂性。对于足够复杂的比较函数,并行化甚至非常小的数组可能是合理的。

关于java - 为什么在 Java8 中将最小粒度定义为 8192 以便从并行排序切换到 Arrays.sort 而不管数据类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36128533/

相关文章:

Java 泛型 : Calling generic Method "...is not applicable for the arguments..."

javascript - 使用 find() 时返回 Object 的属性而不是 Object 本身

c - C 中的数组增量类型 - array[i]++ 与 array[i++]

php - 如何检查不在数组元素中

xslt - xsl :sort: sorting by numeric value

javascript - 使用 append() 对列表进行排序

java - 找不到适合 jdbc :mysql//localhost:3306/test 的驱动程序

java - 使用变更日志 xml 作为流输入运行 liquibase

c++ - 快速排序 3 个值

Java - Maven JAXB-2插件具有不同配置的多个方案不会生成类