javascript - 从解析树到 NFA

我正在寻找将正则表达式转换为 NFA 的方法。我知道我们需要将正则表达式转换为解析树，然后将其转换为 NFA。我正在使用 java 脚本。有没有js工具可以直接根据给定的正则表达式生成解析树？

此外，我对解析树到 NFA 部分的转换感到困惑。

最佳答案

为什么要构建一个解析树呢？将正则表达式直接转换为 NFA 相对简单。

基本案例的数量是有限的。知道了这些，我们就可以从这些案例的某种组合中构建完整的 NFA。考虑可以构建某些正则表达式 R 的所有可能方式。

前三个很简单，但并集、串联和 Kleene 闭包需要一点思考。

将平凡地成为不接受状态的路径。 (令 O 为非接受状态，X 为接受状态。)

(->O)

通往接受状态的路径。

(->X)

一个起始状态，在字符串 'a' 上有一条通往接受状态的路径。

(->O-a>X)

起始状态成为 R1 的起始状态，在 R1 的接受状态和 R2 的起始状态之间添加了 epsilon 转换，R1 的接受状态被移除。图中第二种状态是accepting但不应该。

R1 和 R2 的 epsilon 转换到 NFA 的起始状态——如果可能，机器将“猜测”进入哪个状态。图中R1和R2分别用R和S表示。

添加一个 epsilon 转换，使 R1 可以永远循环!

现在我们有了所有初始可能性的公式，可以将它们组合成一个大型 NFA。例如，对于 (A U B) ∘ C*

可以证明任何 NFA 都可以像这样归纳构造，并且我提供的所有初始构造都是正确的。嗯。

遗憾的是，我不熟悉任何可以满足您要求的 js 工具，但根据上述信息，如果您使用某种合理的表示形式存储基本案例，代码应该相当简单。

要获得更彻底、更少 sleep 不足的解释，请尝试 http://www.codeproject.com/Articles/5412/Writing-own-regular-expression-parser 在深入研究编码之前，您需要真正理解 Thompson 的算法(我所描述的)。该网站看起来比我在这里更深入地了解实现。

祝你好运!

关于javascript - 从解析树到 NFA，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17377913/