java - 在对数时间内找到两个排序数组的中值

标签 java algorithm

我正在努力理解 this solution求两个排序数组的中位数的问题:

public static double findMedianSortedArrays(int A[], int B[]) {
    int m = A.length;
    int n = B.length;

    if ((m + n) % 2 != 0) // odd
        return (double) findKth(A, B, (m + n) / 2, 0, m - 1, 0, n - 1);
    else { // even
        return (findKth(A, B, (m + n) / 2, 0, m - 1, 0, n - 1) 
            + findKth(A, B, (m + n) / 2 - 1, 0, m - 1, 0, n - 1)) * 0.5;
    }
}

public static int findKth(int A[], int B[], int k, 
    int aStart, int aEnd, int bStart, int bEnd) {

    int aLen = aEnd - aStart + 1;
    int bLen = bEnd - bStart + 1;

    // Handle special cases
    if (aLen == 0)
        return B[bStart + k];
    if (bLen == 0)
        return A[aStart + k];
    if (k == 0)
        return A[aStart] < B[bStart] ? A[aStart] : B[bStart];

    int aMid = aLen * k / (aLen + bLen); // a's middle count
    int bMid = k - aMid - 1; // b's middle count

    // make aMid and bMid to be array index
    aMid = aMid + aStart;
    bMid = bMid + bStart;

    if (A[aMid] > B[bMid]) {
        k = k - (bMid - bStart + 1);
        aEnd = aMid;
        bStart = bMid + 1;
    } else {
        k = k - (aMid - aStart + 1);
        bEnd = bMid;
        aStart = aMid + 1;
    }

    return findKth(A, B, k, aStart, aEnd, bStart, bEnd);
}

第一部分我无法理解的是findKth方法中定义的aMid和bMid是如何表示A和B的中间计数的。我手动查看了几个示例,确实可以看到,在比较 A[aMid] 和 B[bMid] 之后,只剩下元素总数的一半。但是定义这两个索引背后的想法是什么?为什么A[aMid]和B[bMid]比较后只剩下一半的元素?任何人都可以向我解释这个解决方案吗?

最佳答案

假设 A[] = {1,5,6,7,8,9} 和 B[] = {2,3,4},那么 A[] 和 B[] 的中位数应该是 5,让我们遍历代码。

  1. findMedianSortedArrays(A, B), m=6, n=3
  2. findKth(A, B, 4, 0, 5, 0, 2)
    • aMid=6*4/(6+3)=2, bMid=4-2-1=1, 因为a[2]=6>b[1]=3, 所以k=4-(1- 0+1)=2,aEnd=2,bStart=2
  3. findKth(A, B, 2, 0, 2, 2, 2)
    • aMid=3*2/(3+1)=1, bMid=2-1-1=0, 因为A[1]=5>B[bMid+bStart]=B[2]=4, 所以k=2-(2-2+1)=1,aEnd=1,bStart=3
  4. findKth(A, B, 1, 0, 1, 3, 2)
    • bLen=0,返回A[aStart+k]=A[0+1]=A[1]=5

所以总体思路是:

  1. 根据数组长度的权重,得到数组可能的中位数。 (引用 aMid 和 bMid)
  2. 比较 A[aMid] 和 B[bMid],如果 (A[aMid] > B[bMid]),则意味着:
    • 对于B[bStart..bMid]中的所有元素,它应该在中位数的左边,这是容易的部分
    • 并且对于A[aMid+1..aEnd]中的所有元素,它应该在中位数的右边。这是因为(aMid-aStart + bMid-bStart) 已经等于(aLen+bLen)/2,并且B[aMid+1..aEnd] 中数组中位数左侧可能有多余的元素。
    • 因此我们将两个数组的大小减半,这就是运行时间复杂度应该为 O(log (m+n)) 的原因。
  3. 如此递归地找到 A[aStart..aMid] 和 B[bMid+1..bEnd] 的中点。

关于java - 在对数时间内找到两个排序数组的中值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32469303/

相关文章:

java - Java封装

ruby - 如何在 Ruby 中编写归并排序算法

algorithm - 哪种排序算法更快?

c - 调用函数后指向 B 树根节点的指针开始指向子节点(应该继续指向根节点)

java - Fruchterman 和 Reingold 算法顶点在输出中占据相同位置(图形布局)

java - 并行数组排序时出现问题

java - 如何使用 while 循环找到最大变量?

java - 通过java代码编译android .apk

java - hibernate 映射和未映射的类和 mysql 设计

algorithm - 图遍历 - 为 2 个实体找到 2 条最短路径,使它们永远不会接触(都在同一节点)