ruby - 从 ruby​​ 的独家范围中获得最大值(value)的最快方法

标签 ruby optimization performance range

好吧,假设你有一个非常大的 ruby 范围。我想找到一种方法来获得范围内的最大值。

Range 是排他性的(用三个点定义),这意味着它的结果中不包括结束对象。它可以由整数、字符串、时间或任何响应 #<=> 的对象组成。和 #succ . (这是对 Range 中开始/结束对象的唯一要求)

这是排他范围的示例:

  past  = Time.local(2010, 1, 1, 0, 0, 0)
  now   = Time.now
  range = past...now

  range.include?(now)  # => false

现在我知道我可以做这样的事情来获得最大值:

  range.max  # => returns 1 second before "now" using Enumerable#max

但这将花费大量时间来执行。我也知道无论最终对象是什么,我都可以减去 1 秒。但是,该对象可能不是 Time,甚至可能不支持 #-。 .我更愿意找到一个有效的通用解决方案,但我愿意将特殊情况代码与回退到通用解决方案相结合(稍后会详细介绍)。

如上所述使用Range#last也不会起作用,因为它是一个独占范围并且不包括结果中的最后一个值。

我能想到的最快的方法是:

  max = nil
  range.each { |value| max = value }

  # max now contains nil if the range is empty, or the max value

这类似于Enumerable#max确实(Range 继承),只是它利用了每个值都将大于前一个的事实,所以我们可以跳过使用 #<=>将每个值与前一个值进行比较(Range#max 的方式)节省了一点时间。

我考虑的另一种方法是为常见的 ruby​​ 类型(如 Integer、String、Time、Date、DateTime)编写特殊案例代码,然后使用上述代码作为后备。它会有点难看,但当遇到这些对象类型时可能更有效,因为我可以使用 Range#last 的减法。无需任何迭代即可获得最大值。

谁能想到比这更有效/更快的方法?

最佳答案

我能想到的最简单的解决方案,它适用于包含范围和排除范围:

range.max

一些其他可能的解决方案:

range.entries.last
range.entries[-1]

这些解决方案都是 O(n),并且对于大范围来说会非常慢。原则上的问题是,Ruby 中的范围值是使用 succ 方法从头开始对所有值迭代枚举的。元素不必必须实现返回先前值的方法(即pred)。

最快的方法是找到最后一项的前导(O(1) 解决方案):

range.exclude_end? ? range.last.pred : range.last

适用于具有实现pred 的元素的范围。更高版本的 Ruby 为整数实现了 pred。如果该方法不存在,您必须自己添加该方法(本质上等同于您建议的特殊情况代码,但实现起来稍微简单一些)。

一些快速基准测试表明,对于大范围(在本例中 range = 1...1000000),最后一种方法是最快的多个数量级,因为它是 O(1):

                                          user     system      total        real
r.entries.last                       11.760000   0.880000  12.640000 ( 12.963178)
r.entries[-1]                        11.650000   0.800000  12.450000 ( 12.627440)
last = nil; r.each { |v| last = v }  20.750000   0.020000  20.770000 ( 20.910416)
r.max                                17.590000   0.010000  17.600000 ( 17.633006)
r.exclude_end? ? r.last.pred : r.last 0.000000   0.000000   0.000000 (  0.000062)

Benchmark code is here .

在注释中建议使用 range.last - (range.exclude_end? ? 1 : 0)。它确实适用于没有其他方法的日期,但永远不适用于非数字范围。 String#- 不存在并且对整数参数没有意义。 String#pred,然而,can be implented .

关于ruby - 从 ruby​​ 的独家范围中获得最大值(value)的最快方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2287025/

相关文章:

java - 使用 StringTokenizer 复制 String.split

c - 对具有固定数量的零的数组进行随机抽样

c - 为什么调用函数时会有开销?

ruby - Windows 7 中的什么文件对应于 linux 文件 ssl.so?

android - 线程 sleep 准确性

ruby - 让 bundler 使用 http : instead of git:?

algorithm - 按顺序生成数字(幂)序列

python - ArithmeticError 导致 cvxpy 出现 "Rank(A) < p or Rank([G; A]) < n"错误

ruby - 将参数传递给 rspec 共享示例

ruby - 将哈希树转换为具有深度键的哈希数组