java - 输入 ANTLR4 没有可行的替代方案

标签 java antlr4

我正在设计一种语言,允许您对数据进行谓词。这是我的词法分析器。

lexer grammar Studylexer;


fragment LETTER : [A-Za-z];
fragment DIGIT : [0-9];
fragment TWODIGIT : DIGIT DIGIT;
fragment MONTH:  ('0' [1-9] | '1' [0-2]);
fragment DAY: ('0' [1-9] | '1' [1-9] | '2' [1-9] | '3' [0-1]);



TIMESTAMP: TWODIGIT ':' TWODIGIT; // représentation de la timestamp 

DATE : TWODIGIT TWODIGIT MONTH DAY; // représentation de la date


ID : LETTER+; // match identifiers 

STRING : '"' ( ~ '"' )* '"' ; // match string content

NEWLINE:'\r'? '\n' ; // return newlines to parser (is end-statement signal)

WS  :   [ \t]+ -> skip ; // toss out whitespace 

LIST: ( LISTSTRING | LISTDATE | LISTTIMESTAMP ) ; // list of variabels;

// list of operators

GT: '>';
LT: '<';
GTEQ: '>=';
LTEQ:'<=';
EQ: '=';
IN: 'in';

fragment LISTSTRING: STRING ',' STRING (',' STRING)*; // list of strings
fragment LISTDATE : DATE   ',' DATE   (',' DATE)*;    // list of dates
fragment LISTTIMESTAMP:TIMESTAMP ',' TIMESTAMP (',' TIMESTAMP )*; // list of timestamps
    
NAMES: 'filename' | 'timestamp' | 'tso' | 'region' | 'processType' | 'businessDate' | 'lastModificationDate'; // name of variables in the where block

KEY: ID '[' NAMES ']' | ID '.' NAMES; // predicat key

这是我语法的一部分。

expr: KEY op = ('>' | '<') value = (  DATE  | TIMESTAMP )  NEWLINE          # exprGTORLT
    | KEY op = ('>='| '<=') value = ( DATE  | TIMESTAMP )  NEWLINE          #  exprGTEQORLTEQ
    | KEY  '=' value = ( STRING | DATE      | TIMESTAMP )  NEWLINE          # exprEQ
    | KEY 'in'   LIST                                      NEWLINE          #exprIn

例如,当我做出谓词时。

tab [key]  in  "value1", "value2" 

ANTLR 生成错误。

no viable alternative at input tab [key] in

我该如何解决这个问题?

最佳答案

第一个 tab [key] 不会像您希望的那样生成 KEY token ,原因有两个:

  1. 它包含空格,并且 KEY 不允许有任何空格。解决这个问题的最佳方法是从词法分析器中删除 KEY 规则,并将其转换为解析器规则(这意味着您还需要将 [ ] 到他们自己的 token 中)。那么输入中的空格将位于标记之间,从而成功跳过。
  2. key 实际上并不是 NAMES 中列出的单词之一。

另一个问题是 in 被识别为 ID token ,而不是 IN token 。这是因为 IDIN 都会生成相同长度的匹配项,并且在这种情况下,首先列出的规则优先。因此,您应该在所有关键字之后定义 ID,否则关键字将永远不会匹配。

关于java - 输入 ANTLR4 没有可行的替代方案,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61010712/

相关文章:

java - GWT:将 Horizo​​ntalPanel 动态转换为 VerticalPAnel

antlr - 从 Antlr 监听器获取返回值?

antlr4 - 在 ANTLR4 语法中嵌入访问者/听众选项

java - rJava 和 java web 应用程序集成错误

c++ - 如何使用C++运行时从CSS提取ANTLR4引号的字符串

antlr4 - ANTLR4: token 重写器—压缩删除周围的空间

c++ - 如何使用 C++ 在 antlr4 中捕获解析异常?

java - 按顺序从 Java 属性文件中提取值?

java - Cellbrowser 在单元格上单击事件

java - 初始化程序对静态字段的非法引用