parsing - 左递归语法的 LR(1) 项集

我阅读了几篇有关创建 LR(1) 项集的论文，但没有一篇涉及左递归语法，例如用于解析表达式的语法。如果我有以下语法，

E -> E + T | T
T -> T * F | F
F -> (E) | NUMBER

我将如何创建 LR(1) 项目集？

最佳答案

对于 LR(1) 解析器来说，左递归本质上并不是问题，并且无论您的语法是否具有左递归，确定配置集和前瞻的规则都是相同的。

就您而言，我们首先使用新的开始符号来增强语法:

S -> E
E -> E + T | T
T -> T * F | F
F -> (E) | NUMBER

我们的初始配置集对应于使用 $ 的前瞻来查看产生式 S -> E。最初，这给了我们以下内容:

(1)
    S -> .E     [$]

我们现在需要扩展 E 的范围。这给了我们这些新项目:

(1)
    S -> .E     [$]
    E -> .E + T [$]
    E -> .T     [$]

现在，让我们看看项目E -> .E + T [$]。我们需要扩展 E 可能在这里，这样做的规则与非左递归情况相同:我们列出 E 的所有产生式点在前面，前瞻由产生式 E -> .E + T [$] 中 E 后面的内容给出。在本例中，我们正在寻找具有 + 前瞻的 E，因为这就是产生式中的内容。这会添加这些项目:

(1)
    S -> .E     [$]
    E -> .E + T [$]
    E -> .T     [$]
    E -> .E + T [+]
    E -> .T     [+]

从这里开始，我们展开了 T 之前有一个点的所有情况，结果如下:

(1)
    S -> .E     [$]
    E -> .E + T [$]
    E -> .T     [$]
    E -> .E + T [+]
    E -> .T     [+]
    T -> .T * F [$]
    T -> .F     [$]
    T -> .T * F [+]
    T -> .F     [+]

我们现在必须在 T -> .T * F [$] 的上下文中扩展 T，为此我们列出了T 后跟 T -> .T * F [$] 中 T 后面的内容(即 *)。这给我们带来了以下结果:

(1)
    S -> .E     [$]
    E -> .E + T [$]
    E -> .T     [$]
    E -> .E + T [+]
    E -> .T     [+]
    T -> .T * F [$]
    T -> .F     [$]
    T -> .T * F [+]
    T -> .F     [+]
    T -> .T * F [*]
    T -> .F     [*]

从这里开始，我们将扩展 F 之前有一个点的产生式。根据目前的情况，您知道如何做到这一点吗？

关于parsing - 左递归语法的 LR(1) 项集，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/71296252/

parsing - 左递归语法的 LR(1) 项集

上一篇：amazon-web-services - AWS CodeBuild 不在断点处暂停

下一篇：regex - 识别推文消息中正确的主题标签索引