假设我有一个 IPRange
对象定义如下:
public class IPRange {
public IPAddress Start { get; set; }
public IPAddress End { get; set; }
public string Description { get; set; }
public DateTime ExpireDate { get; set; }
}
然后我有一个 IPRange[]
这些对象中有成百上千个条目,这些条目具有范围开始/结束的所有不同(正常)值。
var myArray = new IPRange[...];
现在;如果我有 IPAddress
,确定它是否属于任何范围的最快方法是什么?假设:
- 该数组将只包含与我们要匹配的 IP 具有相同地址族 (IPv4/IPv6) 的项目
- 范围可能或可能不“重叠”
- 安
IPRangeComparer
(实现IComparer<IPRange>
,首先按范围开始排序,然后按范围结束(“在”同一开始内)排序)和IPRangeEqualityComparer
(实现IEqualityComparer<IPRange>
,为相同的范围开始和范围结束返回 true)可用,因为是IPAddressComparer
(实现IComparer<IPAddress>
,将 IP 视为字节数组,按数值“排序”它们)
更糟的是,IPRange 还有一个 ExpireDate
( DateTime
) 属性。 IPRange[]
中的条目可能随时到期;所以我们也需要考虑到这一点。 IPRange[]
以设定的时间间隔(比如每小时一次)“重新加载”,因此过期的项目会定期从阵列中“清除”。但是从技术上讲,一个范围可能已经过期但仍然在数组中直到下一次重新加载。我不认为这本身是个大问题,但当我第一次尝试解决这个问题时,它确实增加了一点复杂性。
我可以简单地迭代提供 O(n) 性能的项目,但我希望它的性能(好得多)更好。我最初使用二分搜索实现来快速定位数组中的范围,但是一旦找到一个,数组中左/右可能会有更多范围,然后从那里再次给我 O(n)(可能更糟,取决于我们从那里开始的方式)。
我想知道在这方面什么算法或数据结构(如果有的话)会有所帮助。您可能会说我正在尝试实现白名单(或黑名单,等等)并且需要能够快速判断 IP 是否在该列表中。一旦找到匹配的范围,就无需进一步查找。我不介意每隔一段时间“(重新)构建”一个数据结构;我可以在后台任务中执行此操作,因此可能需要一些时间而不用担心。
在我要查看的列表中,排名不分先后的是:B-Tree、R(*)-Tree、Hilbert R-Tree、Enhanced Interval Trees 和 this question I just found似乎也有一些有趣的信息。
最佳答案
该解决方案是算法问题的算法解决方案,我不知道如何用C#
编程,并且解释不是关于IP
。
主要思想 - 创建一个“子范围”数组(不是真正的术语 - 将很快解释),数组中的每个元素都将包含指向实际范围的指针。
如果你有 (1,5), (3,7)
范围,“子范围”将是 (1,3), (3,5), (5,7)
。并且每个新范围都有指向实际范围的指针 - (1,3) -> (1,5)
, (3,5) -> (1,5) , (3,7)
和 (5,7) -> (3,7)
。
在按开始时间对范围进行排序后,您可以在范围内的一次迭代中创建此数组,并有一个帮助程序数组来保留所有仍然有效的范围。
创建此结构后,您可以搜索一个数字并查看它在哪个“子范围”中。可以使用二进制搜索子范围中的起点(这是以下子范围的终点)来完成).
让我们来分析一些复杂性。每个范围只能将其他范围拆分两次,因此数组的大小为 n
但每个元素也可以包含 n
指针,因此大小为 O( n^2)
(如果您以摊销的方式分析它,可能会更少)。所以 O(n^2)
的大小。
O(n^2)
的构建时间,因为最终结构将在 O(n^2)
中。但搜索时间 - 重要的是,将在 O(log n)
中。
关于c# - 搜索 IP 范围 - 算法/数据结构?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54687181/