python - 创建简单的 LR 解析器闭包项

标签 python parsing compiler-construction parser-generator

假设 G(增强语法):

E' - > E
E  - > E+T|T
T  - > T*F|F
F -  > (E)|id

因此，在 dfa 的创建级别之一中，我已经达到了这一点:(龙书中的 I6)

    I6                   I9
 ---------            ---------
|E -> E+.T|          | E->E+T. |   
|T -> .T*F|     T    | T->T.*F |
|T -> .F  |  ----->   ---------
|F -> .(E)|       
|F -> .id |
 ---------

我想知道，为什么我们不添加 T->.F 和 F->.(E) 和 F->.id 到 I9 ？

当我们在输入字符串中到达 T 时，我们应该添加 T->.F，现在我们已经到达 F，我们应该添加 F->.(E) 和 F->.id。

为什么 I9 不包含这些？

最佳答案

这是因为闭包和 goto 算法的工作原理。因为当您在 I6 上使用 GOTO(T) 创建 I9 时，点在任何 T 上向右移动一步，并将它们添加到新集合中。该组就是 I9 GOTO 组。 I6 中点右侧没有 T 的那些将不会添加到 I9 GOTO 集中。执行 GOTO 后，您将设置 I9

E->E+T.
T->T.*F

当您在集合 I9 上应用闭包时，您将展开点右侧的每个非终结符。在 I9 上，点右侧没有非终结符，因此无需展开。

我最近发表了一篇关于一个非常相似但更复杂的问题的帖子，如果您需要额外的说明，可能会有所帮助，Computing LR1 closure

关于python - 创建简单的 LR 解析器闭包项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9149262/

上一篇：python - 编写一个自定义 Django BaseCommand 类来记录命令详细信息

下一篇：python - 使用python从sqlite db读取unicode

compiler-construction - 解释器实际上是否在内存中预编译？

python - 如何在 pygtk TreeView 中设置单个单元格的颜色？

parsing - 一种解析 sexp 的优雅方式

python - 如何在共享内存中轻松存储python可用的只读数据结构

Javascript:如何在不知道键名的情况下解析 json 数组？

parsing - 语法定向翻译和语义分析

c++ - 编译器使用哪些真正的规则集来决定是否内联函数？

python - 匹配前后如何匹配和创建字典

python - 协调Python Aggdraw中的容器类型以获得最快的渲染速度？