parsing - 树结构 : propagate a subtree to child

标签 parsing antlr antlr3 abstract-syntax-tree

假设我有这个简单且无意义的语法:

propagate     :   what^ where*;
what          :   CHAR^;
where         :   NUMBER -> ^(PLUS NUMBER);

NUMBER        :   '0'..'9';
CHAR          :   'a'..'z';
PLUS          :   '+';

如果它解析像 a123456789 这样的字符串,它会生成一个 AST,如下所示: AST

我要做的是将 what 解析的 token 传递给 where 并创建一个 AST(对于相同的输入),如下所示: AST2

我尝试了以下方法:

propagate       :   w=what^ where[$w.text]*;
what            :   CHAR^;
where[String s] :   NUMBER -> ^(PLUS CHAR[s] NUMBER);

NUMBER          :   '0'..'9';
CHAR            :   'a'..'z';
PLUS            :   '+';

如果 what 它是单个标记,它就可以工作,但如果它是一棵树呢? 这是正确的方法吗?

最佳答案

方法如下:

grammar T;

options {
  output=AST;
  ASTLabelType=CommonTree;
}

parse
 : propagate EOF!
 ;

propagate
 : what^ where[$what.tree]*
 ;

what
 : CHAR
 ;

where[CommonTree lhs]
 : NUMBER -> ^(PLUS {new CommonTree($lhs)} NUMBER)
 ;

NUMBER : '0'..'9';
CHAR   : 'a'..'z';
PLUS   : '+';

ANTLRWorks 的调试器可能无法显示正确的 AST:自己创建一个小型驱动程序类:

import org.antlr.runtime.*;
import org.antlr.runtime.tree.*;
import org.antlr.stringtemplate.*;

public class Main {
  public static void main(String[] args) throws Exception {
    TLexer lexer = new TLexer(new ANTLRStringStream("a123"));
    TParser parser = new TParser(new CommonTokenStream(lexer));
    CommonTree tree = (CommonTree)parser.parse().getTree();  
    DOTTreeGenerator gen = new DOTTreeGenerator();
    StringTemplate st = gen.toDOT(tree);
    System.out.println(st);
  }
}

要运行它,请执行以下操作:

java -cp antlr-3.3.jar org.antlr.Tool T.g 
javac -cp antlr-3.3.jar *.java
java -cp .:antlr-3.3.jar Main > ast.dot

这将生成一个代表以下 AST 的 DOT 文件:

enter image description here

关于parsing - 树结构 : propagate a subtree to child,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14244849/

相关文章:

ANTLR树语法和StringTemplate代码翻译

java - 对于ANTLR3异常,antlrworks可以工作,但生成的java代码无法工作

python3正则表达式寻找1个或多个字符串

c++ - 如何将简单的类似 Lisp 的代码拆分为 C++ 中的标记?

java - antlr如何以任意顺序定义可选部分

c - 使用 ANTLR C 目标,如何在 Lexer 中获取先前匹配的标记?

java - 如何检查 ANTLR 3 中的数字范围?

java - 无法识别 Android ParseDateException EDT 时区

java - 如何使用 REST API 解析具有特定标记服务器的现有 XML 文档

antlr - 如何在antlr中找到 token 的长度?