java - 使用antlr3的简单标准表达式解析器

标签 java antlr antlr3 abstract-syntax-tree

我想用antlr3创建一个简单的条件表达式解析器

更新:单独的 AND OR 表达式规则以支持 AND/OR 不同的层次结构,但遇到了另一个问题: 如果表达式类似于:a = 1 且 b = 2 且 c = 3 根据当前的实现,树应该如下:

       =      =
 (a = 1)(b = 2)(c = 3)
But I want to generate it as follows:
          =       =
    (a = 1)(b = 2)
               (c = 3)
First "and" should be higher priority than another, because I want to parse all the expression as left exp and right exp.

我想我需要在“subcond”中重写规则 使a = 1 且b = 2 且c = 3 -> (a = 1 且b = 2) 且c = 3

但是尝试了很多次都没有成功。有人知道如何实现它吗?谢谢。


我的目标是解析某种 SQL where 子句样式的句子,并构建一个 AST 来演练。

例如:

    a = 1 and (b = 2 or c = 3)            //This one can parse correctly.
    a = 1 and ((b = 2 or c = 3) or d = 4) //This one cannot parse correctly, missing last d = 4 in the tree. 
                                          //Tree is not correct.

我当前的语法文件无法解析上述复杂条件。因为我是 antlr 的新手,不知道如何修改我的语法以更正确地实现上述方法。有人可以帮忙吗? !如有任何建议或意见,我们将不胜感激。

我的语法如下(根据评论更新。警告问题已解决。):

grammar CriteriaExpression;

options {
  output       = AST;
  ASTLabelType = CommonTree;
  language     = Java;
}

tokens {
  AND    = 'and';
  OR     = 'or';
  LPAREN = '(';
  RPAREN = ')';
}

@lexer::header {
package com.antlr;
}

@parser::header {
package com.antlr;
}

eval
:
expression
;

表达式 : 和Exp (OR^ 和Exp)* ;

和Exp : 子条件(AND^ 子条件)* ;

子条件 : LPAREN 表达式 RPAREN |原子 ;

atom
  :
  EXPR OPERATOR EXPR
  ;

OPERATOR
  :
  '='| '<>'| '!='| '<='| '!>'| '<'| '>='| '!<'| '>'| 'like'
  ;

EXPR
  :
  ('a'..'z'| 'A'..'Z'| '0'..'9')+
  ;

 WILDCARD
  :
  '%'
  ;

WS
  :
  ('\t'| ' '| '\r'| '\n'| '\u000C')*
   {$channel = HIDDEN;}
  ;

((a=1)) ((a=1))

a = 1 且 ((b = 2 或 c = 3) 或 d = 4) a = 1 and ((b = 2 or c = 3) or d = 4)

最佳答案

你的语法中的一个缺陷是规则

expression
  :
  LPAREN* subcond RPAREN* (( AND | OR )^ LPAREN* subcond RPAREN*)
  ;

由于您可以拥有任意数量的 LPAREN 或 RPAREN,因此不能保证它们是匹配的。我建议使用类似的东西

expression
  : subcond (( AND | OR ) subcond)?
  | subcond
  ;

对于子条件

subcond
  : atom (( AND | OR )^ atom)*
  | LPAREN expression RPAREN
  ;

理想情况下,您还应该为 ANDOR 表达式制定单独的规则,以便在解析树中具有正确的优先级。

更新: 在更新的语法中,您再次使用 LPAREN*RPAREN* ,它们不会为您提供适当平衡的树。您需要使用递归对多个括号(例如 ((a = 1)) )进行建模,就像我在上面的示例中所描述的那样。这会给出一棵像

的树
((a = 1))
  ^---^--- ATOM
 ^-----^-- Subcond -> Expression
^-------^- Subcond -> Expression

所以树会是这样的:

Expression "((a = 1))"
^
Subcond "(a = 1)"
^
Expression "(a = 1)"
^
Subcond "a = 1"
^
ATOM "a = 1"

关于java - 使用antlr3的简单标准表达式解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14974843/

相关文章:

java - java中用元素返回名称的方法?

java - 在 android 应用程序中读取 mp3 标签

python - 具有相同标签的多个备选方案,只有最后一个获得分配给它的任何东西

constructor - 强制 ANTLR 在解析器中使用我的自定义 TreeAdaptor

antlr - ANTLR 4:避免将错误打印到控制台

parsing - ANTLR : Generate back source file from AST

tree grammar中tree的antlr文法多重性问题

java - 将单个对象转换为数组的函数?

java - 无法在不使用文件 : Prefix 的情况下构造具有相对文件路径的图像对象

java - RuleContext 类实现中的 invokingState 是什么?