java - 使用antlr3的简单标准表达式解析器

我想用antlr3创建一个简单的条件表达式解析器

更新:单独的 AND OR 表达式规则以支持 AND/OR 不同的层次结构，但遇到了另一个问题: 如果表达式类似于:a = 1 且 b = 2 且 c = 3 根据当前的实现，树应该如下:

       =      =
 (a = 1)(b = 2)(c = 3)
But I want to generate it as follows:
          =       =
    (a = 1)(b = 2)
               (c = 3)
First "and" should be higher priority than another, because I want to parse all the expression as left exp and right exp.

我想我需要在“subcond”中重写规则使a = 1 且b = 2 且c = 3 -> (a = 1 且b = 2) 且c = 3

但是尝试了很多次都没有成功。有人知道如何实现它吗？谢谢。

我的目标是解析某种 SQL where 子句样式的句子，并构建一个 AST 来演练。

例如:

    a = 1 and (b = 2 or c = 3)            //This one can parse correctly.
    a = 1 and ((b = 2 or c = 3) or d = 4) //This one cannot parse correctly, missing last d = 4 in the tree. 
                                          //Tree is not correct.

我当前的语法文件无法解析上述复杂条件。因为我是 antlr 的新手，不知道如何修改我的语法以更正确地实现上述方法。有人可以帮忙吗？ !如有任何建议或意见，我们将不胜感激。

我的语法如下(根据评论更新。警告问题已解决。):

grammar CriteriaExpression;

options {
  output       = AST;
  ASTLabelType = CommonTree;
  language     = Java;
}

tokens {
  AND    = 'and';
  OR     = 'or';
  LPAREN = '(';
  RPAREN = ')';
}

@lexer::header {
package com.antlr;
}

@parser::header {
package com.antlr;
}

eval
:
expression
;

表达式 : 和Exp (OR^ 和Exp)* ;

和Exp : 子条件(AND^ 子条件)* ;

子条件 : LPAREN 表达式 RPAREN |原子 ;

atom
  :
  EXPR OPERATOR EXPR
  ;

OPERATOR
  :
  '='| '<>'| '!='| '<='| '!>'| '<'| '>='| '!<'| '>'| 'like'
  ;

EXPR
  :
  ('a'..'z'| 'A'..'Z'| '0'..'9')+
  ;

 WILDCARD
  :
  '%'
  ;

WS
  :
  ('\t'| ' '| '\r'| '\n'| '\u000C')*
   {$channel = HIDDEN;}
  ;

((a=1)) ((a=1))

a = 1 且 ((b = 2 或 c = 3) 或 d = 4) a = 1 and ((b = 2 or c = 3) or d = 4)

最佳答案

你的语法中的一个缺陷是规则

expression
  :
  LPAREN* subcond RPAREN* (( AND | OR )^ LPAREN* subcond RPAREN*)
  ;

由于您可以拥有任意数量的 LPAREN 或 RPAREN，因此不能保证它们是匹配的。我建议使用类似的东西

expression
  : subcond (( AND | OR ) subcond)?
  | subcond
  ;

对于子条件

subcond
  : atom (( AND | OR )^ atom)*
  | LPAREN expression RPAREN
  ;

理想情况下，您还应该为 AND 和 OR 表达式制定单独的规则，以便在解析树中具有正确的优先级。

更新: 在更新的语法中，您再次使用 LPAREN* 和 RPAREN* ，它们不会为您提供适当平衡的树。您需要使用递归对多个括号(例如 ((a = 1)) )进行建模，就像我在上面的示例中所描述的那样。这会给出一棵像

的树

((a = 1))
  ^---^--- ATOM
 ^-----^-- Subcond -> Expression
^-------^- Subcond -> Expression

所以树会是这样的:

Expression "((a = 1))"
^
Subcond "(a = 1)"
^
Expression "(a = 1)"
^
Subcond "a = 1"
^
ATOM "a = 1"

关于java - 使用antlr3的简单标准表达式解析器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14974843/

java - 使用antlr3的简单标准表达式解析器

上一篇：java - 如何修复 Java Web 应用程序中的 Trust Boundary Violation 缺陷

下一篇：java - 如何调试org.xml.sax.SAXParseException； schema_reference.4？