java - 合并排序中的子数组大小

标签 java arrays algorithm mergesort

我无法理解合并排序中子数组的大小。在以下代码中:

   public void mergeSort(List<Integer> list, int low, int high){

       if(low<high){
           int mid = (high+low)/2;
           mergeSort(list,low, mid);
           mergeSort(list,mid+1,high);
           merge(list, low, mid, high);

       }
   }

   private void merge(List<Integer> list ,int low, int mid, int high){

       int lSize = mid-low+1;
       int rSize = high-mid;
   //etc 
   }

对于子数组的大小,我必须在左边加 1,而右边的数组不加 1。我知道如果我们有一个大小为 10 的数组,索引将是 0..9 和 lSize将是 4-0+1,rSize 是 9-4。

我不太确定如何表达这个意思,但我无法思考在何处添加 +1,而无需在脑海中完成大小为 10 的整个示例数组。如果我暂时不接触合并排序,我会忘记在何处添加 +1。有没有更简单的方法来记住这个?谢谢。

最佳答案

溢出漏洞

首先,永远不要先加后除索引。如果数组非常大并且接近数组末尾,则 lowhigh 索引在溢出 Integer.MAX_VALUE 时总和可能为负数。然后,将其除以二将得出负值,而不是您期望的正值。

这是 a Google blog post about the issue . Java 中更正的方法是(注意是>>>,不是>>>):

int mid = (high + low) >>> 1;

推理

话虽如此,下面是解决问题的困难方法,然后是解决问题的简单方法。

问题是如何处理偶数或奇数 low 值和偶数或奇数 high 值,以便左侧和右侧的大小始终相当平衡。

让我们用可接受的 lSizerSize 值制作一个适当平衡的表:

┏━━━━┯━━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┓
┃ low ╲ high ┃     4      ┃     5      ┃
┣━━━━━━┷━━━━━╋━━━━━━━━━━━━╇━━━━━━━━━━━━┫
┃     0      ┃ 2/3 or 3/2 │    3/3     ┃
┣━━━━━━━━━━━━╉────────────┼────────────┨
┃     1      ┃    2/2     │ 2/3 or 3/2 ┃
┗━━━━━━━━━━━━┻━━━━━━━━━━━━┷━━━━━━━━━━━━┛

相关的 mid 值为:

┏━━━━┯━━━━━━━┳━━━┳━━━┓
┃ low ╲ high ┃ 4 ┃ 5 ┃
┣━━━━━━┷━━━━━╋━━━╇━━━┫
┃     0      ┃ 2 │ 2 ┃
┣━━━━━━━━━━━━╉───┼───┨
┃     1      ┃ 2 │ 3 ┃
┗━━━━━━━━━━━━┻━━━┷━━━┛

因此,我们知道它会是类似mid - lowhigh - mid 的东西,但我们可能需要对其进行调整。这些加起来等于您正在处理的总规模吗?

┏━━━━┯━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━┓
┃ low ╲ high ┃           4           ┃           5           ┃
┣━━━━━━┷━━━━━╋━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━┫
┃     0      ┃ (2 - 0) + (4 - 2) = 4 │ (2 - 0) + (5 - 2) = 5 ┃
┣━━━━━━━━━━━━╉───────────────────────┼───────────────────────┨
┃     1      ┃ (2 - 1) + (4 - 2) = 3 │ (3 - 1) + (5 - 3) = 4 ┃
┗━━━━━━━━━━━━┻━━━━━━━━━━━━━━━━━━━━━━━┷━━━━━━━━━━━━━━━━━━━━━━━┛

所以,我们比我们需要的少了一个,所以我们需要在 mid - lowhigh - mid 中添加一个,但是哪一个?好吧,我们为两者制作表格并与我们的第一个表格进行比较。

如果我们将 1 添加到 mid - low 会怎样?

┏━━━━┯━━━━━━━┳━━━━━┳━━━━━┓
┃ low ╲ high ┃  4  ┃  5  ┃
┣━━━━━━┷━━━━━╋━━━━━╇━━━━━┫
┃     0      ┃ 3/2 │ 3/3 ┃
┣━━━━━━━━━━━━╉─────┼─────┨
┃     1      ┃ 2/2 │ 3/2 ┃
┗━━━━━━━━━━━━┻━━━━━┷━━━━━┛

如您所见,这与我们第一个表格中的可接受选项相匹配。如果我们将 1 添加到 high - mid 会怎样?

┏━━━━┯━━━━━━━┳━━━━━┳━━━━━┓
┃ low ╲ high ┃  4  ┃  5  ┃
┣━━━━━━┷━━━━━╋━━━━━╇━━━━━┫
┃     0      ┃ 2/3 │ 2/4 ┃
┣━━━━━━━━━━━━╉─────┼─────┨
┃     1      ┃ 1/3 │ 2/3 ┃
┗━━━━━━━━━━━━┻━━━━━┷━━━━━┛

如您所见,这是不平衡的。

所以,我们有 mid - low + 1high - mid

简单的解决方法

让它调试打印 lSizerSize 值(System.err.printf("L:%d R:%d\n", lSize , rSize);) 将一个添加到 lSize,然后将一个添加到 rSize。尝试使用不同的数组大小,看看哪个最能平衡左侧和右侧。

关于java - 合并排序中的子数组大小,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52843362/

相关文章:

Java 开关语句

java - JDK 1.8 无法与 IntelliJ IDEA 15.0.2 一起使用 "Error: Abnormal build process termination"

c - C 中带有通过 FIFO 管道的指针的结构

javascript - 有人可以帮我理解这段代码吗?

c++ - 从节点和关系生成 block 的算法

algorithm - 如何计算数字的最接近 2 或 10 的幂?

java - HTTP 状态 404 - 请求的资源不可用

java - Java 中的 N 到 N 索引关系

java - 如何为不同行具有不同列号的 Excel 工作表编写 TestNG DataProvider 注释

python - 使用python在文件中写入b-tree