ruby - 解决依赖约束

标签 ruby algorithm graph directed-graph

我有一个经典的依赖解决问题。我以为我正朝着正确的方向前进,但现在我遇到了障碍,我不确定如何继续。

背景

在已知宇宙中(所有工件及其依赖项的缓存),每个工件和版本之间存在 1->n 关系,并且每个版本可能包含一组不同的依赖项。例如:

A
  1.0.0
    B (>= 0.0.0)
  1.0.1
    B (~> 0.1)
B
  0.1.0
  1.0.0

给定一组“需求约束”,我想找到可能的最佳解决方案(其中“最佳”是仍然满足所有约束的最高可能版本)。这是带有解决方案的“需求约束”示例:

solve!('A' => '~> 1.0') #=> {"A" => "1.0.1", "B" => "0.1.0"}

实际上,需求要多得多:

solve!('A' => '~> 1.0', 'B' => '>= 0.0.0', 'C' => '...', 'D' => '...')

(版本遵循semantic versioning标准)

我试过了

当前的解决方案使用回溯并且性能不是很好。我做了一些挖掘,发现性能问题是由于宇宙的大小造成的。我决定尝试另一种方法,并为一组需求构造一个“可能性”DAG 图:

class Graph
  def initialize
    @nodes = {}
    @edges = {}
  end

  def node(object)
    @nodes[object] ||= Set.new
    self
  end

  def edge(a, b)
    node(a)
    node(b)

    @nodes[a].add(b)

    self
  end

  def nodes
    @nodes.keys
  end

  def edges
    @nodes.values
  end

  def adjacencies(node)
    @nodes[node]
  end
end

然后,我构建了一个包含宇宙中所有可能解决方案的 DAG。这大大减少了可能性的数量,并为我提供了一个具有真实工件可能性的实际图表。

def populate(artifact)
  return if loaded?(artifact)

  @graph.node(artifact)

  artifact.dependencies.each do |dependency|
    versions_for(dependency).each do |dependent_artifact|
      @graph.edge(artifact, dependent_artifact)
      populate(dependent_artifact)
    end
  end
end

private

def versions_for(dependency)
  possibles = @universe.versions(dependency.name, dependency.constraint)

  # Short-circuit if there are no versions for this dependency,
  # since we know the graph won't be solvable.
  raise "No solution for #{dependency}!" if possibles.empty?

  possibles
end

因此,根据前面的示例图,如果我有需求 'A', '>= 0.0.0',我的 DAG 将如下所示:

+---------+   +---------+
| A-1.0.0 |   | A-1.0.1 |
+---------+   +---------+
       /  \        |
      /    \       |
     /      \      |
    /        \     |
+---------+   +---------+
| B-1.0.0 |   | B-0.1.0 |
+---------+   +---------+

由于 A-1.0.0 的可能值是“B 的任何值”,但 A-1.0.1 的约束是“0.1 系列中的任何 B”。这目前正在按预期工作(使用完整的测试套件)。

换句话说,DAG 采用抽象的依赖约束并创建一个“真实的”图,其中每条边都是一个依赖关系,每个顶点(我称之为节点)是一个实际的工件.如果存在解决方案,则它位于该图中的某处。

可悲的是,这就是我卡住的地方。我无法想出一种算法或程序来通过这张图找到“最佳”路径。我也不确定有什么方法可以检测图形是否不可解。

我做了一些研究,我认为拓扑排序 (tsort) 是我需要的过程。但是,该算法确定依赖项的插入顺序,而不是最佳解决方案。

我相当确定这是一个 np-hard 问题,并且可能会导致运行时效率低下。我虽然使用 DAG 会减少我必须做的比较次数。我这个假设错了吗?有没有更好的数据结构可以使用?

最后的想法

  • 我已将此问题标记为“Ruby”,因为我使用的是 Ruby,但我正在寻找伪代码/方向。这不是家庭作业问题 - 我真的很想学习。
  • 我已尽力提供尽可能多的背景知识,但如果您想了解有关特定主题的更多详细信息,请发表评论。这已经是一篇很长的文章了,但我确实有更多代码可以分享。

最佳答案

我不是这个问题的专家,我提出了一个不是最优的完整解决方案,因为有很多东西可以优化..

算法很简单,理想情况下是递归集交集DFS :

算法

防御

Define: Name as String on format [ .* ]
Define: Version as String on format [ dd.dd.dd ]
Define: Revision as { Name, Version, Requirement }
Define: Range<T> as { min<T>, max<T> }
Define: Condition as { Name, Range<Version> }
Define: Requirement as Set<Revision> OR as Set<Condition>
Define: Component as { Name, Range<Version>, Requirement }
Define: System as Set<Component>

输入

Input: T as System aka basis
Input: C as Set<Condition> aka conditions to apply

初始化

Init: S as Set<Condition> = { S[i] as Condition | S[i] = {T[i].Name,T[i].Range} }
Init: Q as Stack<Condition> = { push(q) | q[i] = C[i] }

过程

for (Condition c in C)
{
    S.find(c.Name).apply(c)
}

While (Q.size > 0)
{
    Condition q = Q.pop()

    switch (T.assert(S.find(q.Name),q))
    {
      case VALID:
        S.find(q.Name).apply(q)
        q.push(S.find(q.Name).Requirement)

      case INVALID:
        S.find(q.Name).set(INVALID)

      case IDENTICAL:
      case SKIP:
    }
}

return S aka Solution

操作

Stack.push 在堆栈的前面插入一个项目

Stack.pop 从栈顶移除一个项目

System.assert(Condition a, Condition b):
    if (a is INVALID) then return SKIP
    else if (b.Range = a.Range) then IDENTICAL
    else if (b.Range - a.Range = {}) then VALID
    else INVALID

Set.find(x) 根据条件 x 搜索一个项目

Condition.apply(Condition b) = { this.Name, intersection(this.Range,b.Range) }

关于ruby - 解决依赖约束,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22615659/

相关文章:

c - 中值滤波,窗口大小 3,5,7,带 C

graph - 如何使用 morris.js 更改 x 轴精度?

audio - 如何将包含纯音的音频文件转换回序列化数据?

ruby - 提前返回 vs if 在 ruby​​ 代码中

ruby-on-rails - 在 Rails 中动态包含对象的关联

ruby-on-rails - 用户回形针重命名上传的文件

ruby - 如何声明一个可在整个 Rails 应用程序中访问的变量?

c# - 是否有一个预先存在的函数会根据基数和 "offset"返回一组数字?

python - Django/Python - 将数据收集到正确的形式(算法)

python - 有没有一种简单易用的方法来可视化高维数据?