javascript - 如何相交两个范围数组?

标签 javascript arrays algorithm range

range 为两个整数的数组:startend(例如 [40, 42])。

有两个范围数组(已排序),我想找到计算它们交集的最佳方法(这将导致另一个范围数组):

A = [[1, 3], [7, 9], [12, 18]]
B = [[2, 3], [4,5], [6,8], [13, 14], [16, 17]]

十字路口:

[[2, 3], [7, 8], [13, 14], [16, 17]]

最佳算法是什么?


天真的方法是检查所有其他的每一个,但这显然不是最优的。

我在 VBA 中发现了一个类似的问题,要求同样的事情:Intersection of two arrays of ranges

最佳答案

由于输入数组已排序,因此计算起来应该相当简单。我假设任何一个输入数组中的范围都不会相互交叉(否则,“已排序”将是模棱两可的)。考虑每个数组中的一个范围(由“当前范围”索引 ab 定义)。有几种情况(除了“完全重叠”之外的每种情况都有 AB 颠倒的镜像):

没有交集:

A[a]: |------|
B[b]:          |---|

因为数组是有序的,A[a]不能与B中的任何东西相交,所以可以跳过(增加a)。

部分重叠(B[b] 超出A[a]):

A[a]: |-------|
B[b]:      |-------|

在这种情况下,将交集添加到输出,然后递增 a,因为 A[a] 不能与 B 中的任何其他内容相交。

收容(可能有一致的结局):

A[a]: |------|
B[b]:   |--|

再次将交集添加到输出中,这次递增 b。请注意,进一步的轻微优化是,如果 A[a]B[b] 以相同的值结束,那么您可以递增 b同样,因为 B[b] 也不能与 A 中的任何其他内容相交。 (两端重合的情况可以归为部分重叠的情况。这种情况可以称为“严格遏制”。)

完全重叠:

A[a]: |------|
B[b]: |------|

将交集添加到输出并递增 ab(两个范围都不能与另一个数组中的任何其他内容相交)。

继续迭代上述内容,直到 ab 运行到相应数组的末尾,您就完成了。

将上面的内容转化为代码应该是微不足道的

编辑:为了支持最后一句话(好吧,这不是微不足道的),这是我的代码版本。由于所有情况,这有点乏味,但每个分支都非常简单。

const A = [[1, 3], [7, 9], [12, 18]];
const B = [[2, 3], [4, 5], [6, 8], [13, 14], [16, 17]];

const merged = [];

var i_a = 0,
    i_b = 0;

while (i_a < A.length && i_b < B.length) {
  const a = A[i_a];
  const b = B[i_b];

  if (a[0] < b[0]) {
    // a leads b
    if (a[1] >= b[1]) {
      // b contained in a
      merged.push([b[0], b[1]]);
      i_b++;
      if (a[1] === b[1]) {
        // a and b end together
        i_a++;
      }
    } else if (a[1] >= b[0]) {
      // overlap
      merged.push([b[0], a[1]]);
      i_a++;
    } else {
      // no overlap
      i_a++;
    }
  } else if (a[0] === b[0]) {
    // a and b start together
    if (a[1] > b[1]) {
      // b contained in a
      merged.push([a[0], b[1]]);
      i_b++;
    } else if (a[1] === b[1]) {
      // full overlap
      merged.push([a[0], a[1]]);
      i_a++;
      i_b++;
    } else /* a[1] < b[1] */ {
      // a contained in b
      merged.push([a[0], a[1]]);
      i_a++;
    }
  } else /* a[0] > b[0] */ {
    // b leads a
    if (b[1] >= a[1]) {
      // containment: a in b
      merged.push([a[0], b[1]]);
      i_a++;
      if (b[1] === a[1]) {
        // a and b end together
        i_b++;
      }
    } else if (b[1] >= a[0]) {
      // overlap
      merged.push([a[0], b[1]]);
      i_b++
    } else {
      // no overlap
      i_b++;
    }
  }
}
console.log(JSON.stringify(merged));

您要求优化算法。我相信我的非常接近最佳。它与两个数组中的范围数以线性时间运行,因为每次迭代完成至少一个范围(有时是两个)的处理。它需要常量内存加上构建结果所需的内存。

我应该注意,与 CertainPerformance 的答案(我写这篇文章时这里发布的唯一其他答案)不同,我的代码适用于任何类型的数字范围数据,而不仅仅是整数。 (如果您混合使用数字和数字的字符串表示形式,则可能需要将上面的 === 替换为 ==)。 CertainPerformance 的算法将范围展平为跨越范围的连续整数数组。如果整数总数为 n,则他的算法在 O(n2) 时间和 O(n) 空间内运行。 (因此,例如,如果其中一个范围是 [1, 50000],则需要存储 50,000 个数字的内存和与其平方成正比的时间。)

关于javascript - 如何相交两个范围数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49453867/

相关文章:

javascript - 获取对象内的数组数量

python - 如何使用另一个数组的值过滤 numpy 数组?

python - 计算排列中的排列数

javascript - 移动网站 - 右侧空白区域

c - C程序中如何存储变量值?

javascript - 悬停时 Bootstrap 下拉菜单不起作用,我做错了什么?

algorithm - 动态规划减少蛮力

c++ - 这些代码片段有什么区别?

javascript - 面向对象的 JavaScript 示例

javascript - 来自 &lt;input type ="file"> 以外的源的 FileReader.readAsArray()