parsing - 为什么这个表达式没有被正确解析?

标签 parsing scripting programming-languages antlr grammar

注意:这是主题 posted HERE 的延续.

我正在为 Jass scripting language 开发一个解析器( here's an excellent API reference for it ) 这样我就可以将它用作另一种语言的解释器。使用 ANTLR4 + ANTLRWorks 2,我运行了 this complex script测试词法分析器/解析器的强度,并通过了几乎所有测试。 失败的部分位于“elseif”语句中,其中包含一个表达式:

  • 外括号...
  • 数组元素...
  • bool /二元运算,AND...
  • 一元常数整数

...像这样:

elseif(si__DroneSystem___data_V[this]!=-1)then (脚本第 53 行)


我对语法所做的任何更改都无法获得 ANTLR将此输入识别为正确的表达式。到目前为止,我已经编写了以下语法:

grammar Jass;

//----------------------------------------------------------------------
// Global Declarations
//----------------------------------------------------------------------
program                 : file+
                        ;
file                    : declaration* function
                        ;
declaration             : globals | typedef | native_func
                        ;
typedef                 : KEYWORD_TYPE identifier KEYWORD_EXTENDS (TYPE_HANDLE | identifier) 
                        ;
globals                 : KEYWORD_GLOBALS global_var_list KEYWORD_ENDGLOBALS
                        ;
global_var_list         : var_declaration*
                        ;
native_func             : KEYWORD_CONSTANT? KEYWORD_NATIVE func_declaration
                        ;
func_declaration        : identifier KEYWORD_TAKES (KEYWORD_NOTHING | parameter_list) KEYWORD_RETURNS (KEYWORD_NOTHING | type)
                        ;
parameter_list          : type identifier (',' type identifier)*
                        ;
function                : KEYWORD_CONSTANT? KEYWORD_FUNCTION func_declaration local_var_list statement_list KEYWORD_ENDFUNCTION
                        ;

//----------------------------------------------------------------------
// Local Declarations
//----------------------------------------------------------------------
local_var_list          : (KEYWORD_LOCAL? var_declaration)*
                        ;
var_declaration         : KEYWORD_CONSTANT type identifier '=' expression
                        | type identifier ('=' expression)? | type TYPE_ARRAY identifier
                        ;

//----------------------------------------------------------------------
// Statements
//----------------------------------------------------------------------
statement_list          : statement*
                        ;
statement               : set | call | if_statement | loop | exitwhen | return_statement | debug
                        ;
set                     : KEYWORD_SET identifier '=' expression | KEYWORD_SET identifier OPENBRACKET expression CLOSEBRACKET '=' expression
                        ;
call                    : KEYWORD_CALL identifier OPENPARENTHESIS args? CLOSEPARENTHESIS
                        ;
args                    : expression (COMMA expression)*
                        ;
if_statement            : KEYWORD_IF expression KEYWORD_THEN statement_list else_clause? KEYWORD_ENDIF
                        ;
else_clause             : KEYWORD_ELSEIF ((OPENPARENTHESIS expression CLOSEPARENTHESIS) | expression) KEYWORD_THEN statement_list
                        | KEYWORD_ELSE ((OPENPARENTHESIS statement_list CLOSEPARENTHESIS) | statement_list) else_clause?
                        ;
loop                    : KEYWORD_LOOP statement_list KEYWORD_ENDLOOP
                        ;
                        // must appear in a loop
exitwhen                : KEYWORD_EXITWHEN expression
                        ;
return_statement        : KEYWORD_RETURN expression?
                        ;
debug                   : KEYWORD_DEBUG (set | call | if_statement | loop)
                        ;

//----------------------------------------------------------------------
// Expressions
//----------------------------------------------------------------------
expression              : parenthesis
                        | func_call
                        | array_ref
                        | (boolean_expression | binary_operation)
                        | unary_operation
                        | function_reference
                        | const_statement
                        | identifier
                        ;
binary_operation        : terminal (('+'|'-'|'*'|'/'|'>'|'<'|'=='|'!='|'>='|'<=') terminal)
                        ;
unary_operation         : ('+'|'-'|'not') terminal
                        ;
boolean_expression      : ('and'|'not')? terminal (('=='|'!=') terminal) ('and'|'or')?
                        ;
terminal                : factor*/(factor)
                        ;
factor                  : identifier
                        | const_statement
                        | parenthesis
                        | brackets
                        ;
parenthesis             : OPENPARENTHESIS expression CLOSEPARENTHESIS
                        ;
brackets                : OPENBRACKET expression CLOSEBRACKET
                        ;
                        // expression must be integer or real when used with unary '+'
func_call               : identifier OPENPARENTHESIS args? CLOSEPARENTHESIS
                        ;
array_ref               : identifier OPENBRACKET expression CLOSEBRACKET
                        ;
function_reference      : KEYWORD_FUNCTION identifier
                        ;
const_statement         : INTEGER_CONST | REAL_CONST | BOOL_CONST | STRING_CONST | ASSIGNMENT_TYPE_NULL
                        ;
FOURCC                  : QUOTATION_SINGLE . . . . QUOTATION_SINGLE
                        ;
INTEGER_CONST           : DECIMAL | OCTAL | HEXIDECIMAL | FOURCC
                        ;
DECIMAL                 : (DIGIT)+ | (DIGIT+) '.' (DIGIT+)?
                        ;
OCTAL                   : '0'..'7'+
                        ;
HEXIDECIMAL             : '$'(DIGIT|'a'..'f'|'A'..'F')+ | '0'('x'|'X')(DIGIT|'a'..'f'|'A'..'F')+
                        ;
REAL_CONST              : (DIGIT)+'.'(DIGIT)* | '.'(DIGIT)+
                        ;
BOOL_CONST              : ASSIGNMENT_TYPE_TRUE | ASSIGNMENT_TYPE_FALSE
                        ;
                        // any double-quotes in the string must be escaped with \
STRING_CONST            : QUOTATION_DOUBLE .*? QUOTATION_DOUBLE
                        ;

//----------------------------------------------------------------------
// Base
//----------------------------------------------------------------------
type                    : nativetype | commontype
                        ;
identifier              : ID
                        ;

//////////////////////////////////////////////////////////////////////////////////////////////
// TYPES
//////////////////////////////////////////////////////////////////////////////////////////////
TYPE_BOOLEAN            : 'boolean'
                        ;
TYPE_CODE               : 'code'
                        ;
TYPE_HANDLE             : 'handle'
                        ;
TYPE_INTEGER            : 'integer'
                        ;
TYPE_REAL               : 'real'
                        ;
TYPE_STRING             : 'string'
                        ;
TYPE_ARRAY              : 'array'
                        ;
nativetype              : TYPE_BOOLEAN
                        | TYPE_CODE
                        | TYPE_HANDLE
                        | TYPE_INTEGER
                        | TYPE_REAL
                        | TYPE_STRING
                        | TYPE_ARRAY
                        ;
TYPE_ABILITY            : 'ability'
                        ;
TYPE_AGENT              : 'agent'
                        ;
TYPE_AIDIFFICULTY       : 'aidifficulty'
                        ;
TYPE_ALLIANCETYPE       : 'alliancetype'
                        ;
TYPE_ATTACKTYPE         : 'attacktype'
                        ;
TYPE_BLENDMODE          : 'blendmode'
                        ;
TYPE_BOOLEXPR           : 'boolexpr'
                        ;
TYPE_BUFF               : 'buff'
                        ;
TYPE_BUTTON             : 'button'
                        ;
TYPE_CAMERAFIELD        : 'camerafield'
                        ;
TYPE_CAMERASETUP        : 'camerasetup'
                        ;
TYPE_CONDITIONFUNC      : 'conditionfunc'
                        ;
TYPE_DAMAGETYPE         : 'damagetype'
                        ;
TYPE_DEFEATCONDITION    : 'defeatcondition'
                        ;
TYPE_DESTRUCTABLE       : 'destructable'
                        ;
TYPE_DIALOG             : 'dialog'
                        ;
TYPE_DIALOGEVENT        : 'dialogevent'
                        ;
TYPE_EFFECT             : 'effect'
                        ;
TYPE_EVENTID            : 'eventid'
                        ;
TYPE_FGAMESTATE         : 'fgamestate'
                        ;
TYPE_FILTERFUNC         : 'filterfunc'
                        ;
TYPE_FOGMODIFIER        : 'fogmodifier'
                        ;
TYPE_FOGSTATE           : 'fogstate'
                        ;
TYPE_FORCE              : 'force'
                        ;
TYPE_GAMECACHE          : 'gamecache'
                        ;
TYPE_GAMEDIFFICULTY     : 'gamedifficulty'
                        ;
TYPE_GAMEEVENT          : 'gameevent'
                        ;
TYPE_GAMESPEED          : 'gamespeed'
                        ;
TYPE_GAMESTATE          : 'gamestate'
                        ;
TYPE_GAMETYPE           : 'gametype'
                        ;
TYPE_GROUP              : 'group'
                        ;
TYPE_HASHTABLE          : 'hashtable'
                        ;
TYPE_IGAMESTATE         : 'igamestate'
                        ;
TYPE_IMAGE              : 'image'
                        ;
TYPE_ITEM               : 'item'
                        ;
TYPE_ITEMPOOL           : 'itempool'
                        ;
TYPE_ITEMTYPE           : 'itemtype'
                        ;
TYPE_LEADERBOARD        : 'leaderboard'
                        ;
TYPE_LIGHTNING          : 'lightning'
                        ;
TYPE_LIMITOP            : 'limitop'
                        ;
TYPE_LOCATION           : 'location'
                        ;
TYPE_MAPCONTROL         : 'mapcontrol'
                        ;
TYPE_MAPDENSITY         : 'mapdensity'
                        ;
TYPE_MAPFLAG            : 'mapflag'
                        ;
TYPE_MAPSETTING         : 'mapsettings'
                        ;
TYPE_MAPVISIBILITY      : 'mapvisibility'
                        ;
TYPE_MULTIBOARD         : 'multiboard'
                        ;
TYPE_MULTIBOARDITEM     : 'multiboarditem'
                        ;
TYPE_PATHINGTYPE        : 'pathingtype'
                        ;
TYPE_PLACEMENT          : 'placement'
                        ;
TYPE_PLAYER             : 'player'
                        ;
TYPE_PLAYERCOLOR        : 'playercolor'
                        ;
TYPE_PLAYEREVENT        : 'playerevent'
                        ;
TYPE_PLAYERGAMERESULT   : 'playergameresult'
                        ;
TYPE_PLAYERSCORE        : 'playerscore'
                        ;
TYPE_PLAYERSLOTSTATE    : 'playerslotstate'
                        ;
TYPE_PLAYERSTATE        : 'playerstate'
                        ;
TYPE_PLAYERUNITEVENT    : 'playerunitevent'
                        ;
TYPE_QUEST              : 'quest'
                        ;
TYPE_QUESTITEM          : 'questitem'
                        ;
TYPE_RACE               : 'race'
                        ;
TYPE_RACEPREFERENCE     : 'racepreference'
                        ;
TYPE_RARITYCONTROL      : 'raritycontrol'
                        ;
TYPE_RECT               : 'rect'
                        ;
TYPE_REGION             : 'region'
                        ;
TYPE_SOUND              : 'sound'
                        ;
TYPE_SOUNDTYPE          : 'soundtype'
                        ;
TYPE_STARTLOCPRIO       : 'startlocprio'
                        ;
TYPE_TERRAINDEFORMATION : 'terraindeformation'
                        ;
TYPE_TEXMAPFLAGS        : 'texmapflags'
                        ;
TYPE_TEXTTAG            : 'texttag'
                        ;
TYPE_TIMER              : 'timer'
                        ;
TYPE_TIMERDIALOG        : 'timerdialog'
                        ;
TYPE_TRACKABLE          : 'trackable'
                        ;
TYPE_TRIGGER            : 'trigger'
                        ;
TYPE_TRIGGERACTION      : 'triggeraction'
                        ;
TYPE_TRIGGERCONDITION   : 'triggercondition'
                        ;
TYPE_UBERSPLAT          : 'ubersplat'
                        ;
TYPE_UNIT               : 'unit'
                        ;
TYPE_UNITEVENT          : 'unitevent'
                        ;
TYPE_UNITPOOL           : 'unitpool'
                        ;
TYPE_UNITSTATE          : 'unitstate'
                        ;
TYPE_UNITTYPE           : 'unittype'
                        ;
TYPE_VERSION            : 'version'
                        ;
TYPE_VOLUMEGROUP        : 'volumegroup'
                        ;
TYPE_WEAPONTYPE         : 'weapontype'
                        ;
TYPE_WEATHEREFFECT      : 'weathereffect'
                        ;
TYPE_WIDGET             : 'widget'
                        ;
TYPE_WIDGETEVENT        : 'widgetevent'
                        ;
commontype              : TYPE_ABILITY
                        | TYPE_AGENT
                        | TYPE_AIDIFFICULTY
                        | TYPE_ALLIANCETYPE
                        | TYPE_ATTACKTYPE
                        | TYPE_BLENDMODE
                        | TYPE_BOOLEXPR
                        | TYPE_BUFF
                        | TYPE_BUTTON
                        | TYPE_CAMERAFIELD
                        | TYPE_CAMERASETUP
                        | TYPE_CONDITIONFUNC
                        | TYPE_DAMAGETYPE
                        | TYPE_DEFEATCONDITION
                        | TYPE_DESTRUCTABLE
                        | TYPE_DIALOG
                        | TYPE_DIALOGEVENT
                        | TYPE_EFFECT
                        | TYPE_EVENTID
                        | TYPE_FGAMESTATE
                        | TYPE_FILTERFUNC
                        | TYPE_FOGMODIFIER
                        | TYPE_FOGSTATE
                        | TYPE_FORCE
                        | TYPE_GAMECACHE
                        | TYPE_GAMEDIFFICULTY
                        | TYPE_GAMEEVENT
                        | TYPE_GAMESPEED
                        | TYPE_GAMESTATE
                        | TYPE_GAMETYPE
                        | TYPE_GROUP
                        | TYPE_HASHTABLE
                        | TYPE_IGAMESTATE
                        | TYPE_IMAGE
                        | TYPE_ITEM
                        | TYPE_ITEMPOOL
                        | TYPE_ITEMTYPE
                        | TYPE_LEADERBOARD
                        | TYPE_LIGHTNING
                        | TYPE_LIMITOP
                        | TYPE_LOCATION
                        | TYPE_MAPCONTROL
                        | TYPE_MAPDENSITY
                        | TYPE_MAPFLAG
                        | TYPE_MAPSETTING
                        | TYPE_MAPVISIBILITY
                        | TYPE_MULTIBOARD
                        | TYPE_MULTIBOARDITEM
                        | TYPE_PATHINGTYPE
                        | TYPE_PLACEMENT
                        | TYPE_PLAYER
                        | TYPE_PLAYERCOLOR
                        | TYPE_PLAYEREVENT
                        | TYPE_PLAYERGAMERESULT
                        | TYPE_PLAYERSCORE
                        | TYPE_PLAYERSLOTSTATE
                        | TYPE_PLAYERSTATE
                        | TYPE_PLAYERUNITEVENT
                        | TYPE_QUEST
                        | TYPE_QUESTITEM
                        | TYPE_RACE
                        | TYPE_RACEPREFERENCE
                        | TYPE_RARITYCONTROL
                        | TYPE_RECT
                        | TYPE_REGION
                        | TYPE_SOUND
                        | TYPE_SOUNDTYPE
                        | TYPE_STARTLOCPRIO
                        | TYPE_TERRAINDEFORMATION
                        | TYPE_TEXMAPFLAGS
                        | TYPE_TEXTTAG
                        | TYPE_TIMER
                        | TYPE_TIMERDIALOG
                        | TYPE_TRACKABLE
                        | TYPE_TRIGGER
                        | TYPE_TRIGGERACTION
                        | TYPE_TRIGGERCONDITION
                        | TYPE_UBERSPLAT
                        | TYPE_UNIT
                        | TYPE_UNITEVENT
                        | TYPE_UNITPOOL
                        | TYPE_UNITSTATE
                        | TYPE_UNITTYPE
                        | TYPE_VERSION
                        | TYPE_VOLUMEGROUP
                        | TYPE_WEAPONTYPE
                        | TYPE_WEATHEREFFECT
                        | TYPE_WIDGET
                        | TYPE_WIDGETEVENT
                        ;
//////////////////////////////////////////////////////////////////////////////////////////////

ASSIGNMENT_TYPE_NULL    : 'null'
                        ;
ASSIGNMENT_TYPE_INTEGER : DIGIT
                        ;
ASSIGNMENT_TYPE_REAL    : REAL_CONST
                        ;
ASSIGNMENT_TYPE_TRUE    : 'true'
                        ;
ASSIGNMENT_TYPE_FALSE   : 'false'
                        ;
KEYWORD_DEBUG           : 'debug'
                        ;
KEYWORD_EXTENDS         : 'extends'
                        ;
KEYWORD_NATIVE          : 'native'
                        ;
KEYWORD_FUNCTION        : 'function'
                        ;
KEYWORD_ENDFUNCTION     : 'endfunction'
                        ;
KEYWORD_TAKES           : 'takes'
                        ;
KEYWORD_NOTHING         : 'nothing'
                        ;
KEYWORD_RETURNS         : 'returns'
                        ;
KEYWORD_CALL            : 'call'
                        ;
KEYWORD_RETURN          : 'return'
                        ;
KEYWORD_GLOBALS         : 'globals'
                        ;
KEYWORD_ENDGLOBALS      : 'endglobals'
                        ;
KEYWORD_LOCAL           : 'local'
                        ;
KEYWORD_CONSTANT        : 'constant'
                        ;
KEYWORD_SET             : 'set'
                        ;
KEYWORD_IF              : 'if'
                        ;
KEYWORD_THEN            : 'then'
                        ;
KEYWORD_ELSEIF          : 'elseif'
                        ;
KEYWORD_ELSE            : 'else'
                        ;
KEYWORD_ENDIF           : 'endif'
                        ;
KEYWORD_LOOP            : 'loop'
                        ;
KEYWORD_EXITWHEN        : 'exitwhen'
                        ;
KEYWORD_ENDLOOP         : 'endloop'
                        ;
KEYWORD_TYPE            : 'type'
                        ;
ID                      : (LETTER)((LETTER|DIGIT|'_'+)*)?
                        ;
fragment
LETTER                  : '\u0024' // $
                        | '\u0041'..'\u005a' // A-Z
                        | '\u005f' // _
                        | '\u0061'..'\u007a' // a-z
                        | '\u00c0'..'\u00d6' // Latin Capital Letter A with grave - Latin Capital letter O with diaeresis
                        | '\u00d8'..'\u00f6' // Latin Capital letter O with stroke - Latin Small Letter O with diaeresis
                        | '\u00f8'..'\u00ff' // Latin Small Letter O with stroke - Latin Small Letter Y with diaeresis
                        | '\u0100'..'\u1fff' // Latin Capital Letter A with macron - Latin Small Letter O with stroke and acute
                        | '\u3040'..'\u318f' // Hiragana
                        | '\u3300'..'\u337f' // CJK compatibility
                        | '\u3400'..'\u3d2d' // CJK compatibility
                        | '\u4e00'..'\u9fff' // CJK compatibility
                        | '\uf900'..'\ufaff' // CJK compatibility
                        ;

fragment
DIGIT                   : '0'..'9'/*'\u0030'..'\u0039' // 0-9
                        | '\u0660'..'\u0669' // Arabic-Indic Digit 0-9
                        | '\u06f0'..'\u06f9' // Extended Arabic-Indic Digit 0-9
                        | '\u0966'..'\u096f' // Devanagari 0-9
                        | '\u09e6'..'\u09ef' // Bengali 0-9
                        | '\u0a66'..'\u0a6f' // Gurmukhi 0-9
                        | '\u0ae6'..'\u0aef' // Gujarati 0-9
                        | '\u0b66'..'\u0b6f' // Oriya 0-9
                        | '\u0be7'..'\u0bef' // Tami 0-9
                        | '\u0c66'..'\u0c6f' // Telugu 0-9
                        | '\u0ce6'..'\u0cef' // Kannada 0-9
                        | '\u0d66'..'\u0d6f' // Malayala 0-9
                        | '\u0e50'..'\u0e59' // Thai 0-9
                        | '\u0ed0'..'\u0ed9' // Lao 0-9
                        | '\u1040'..'\u1049' // Myanmar 0-9?*/
                        ;
OPENPARENTHESIS         : '('
                        ;
CLOSEPARENTHESIS        : ')'
                        ;
OPENBRACKET             : '['
                        ;
CLOSEBRACKET            : ']'
                        ;
QUOTATION_DOUBLE        : '"'
                        ;
QUOTATION_SINGLE        : '\''
                        ;
COMMA                   : ','
                        ;
WS                      : (' ' | '\t' | '\n'+)+ {skip();}
                        ;
LINE_COMMENT            : '//' ~[\r\n]* -> channel(HIDDEN)
                        ;


来自ANTLRWorks ...
THIS file是使用 TestRig 的输出日志(从第一个错误开始),这是生成的解析树的图像,其中第一个错误发生:

CLICK HERE to enlarge


致任何可以帮助我解决此问题的人:如果您被标记为此问题的答案,我将很乐意为您的答案以及接下来的 3 个问题投票。 谢谢!

最佳答案

查看 if 语句的 BNF 规则时:

ifthenelse
         ::= 'if' expr 'then' newline statement_list else_clause? 'endif'
else_clause
         ::= 'else' newline statement_list
           | 'elseif' expr 'then' newline statement_list else_clause?

您的翻译:

if_statement            : KEYWORD_IF expression KEYWORD_THEN statement_list else_clause? KEYWORD_ENDIF
                        ;
else_clause             : KEYWORD_ELSEIF ((OPENPARENTHESIS expression CLOSEPARENTHESIS) | expression) KEYWORD_THEN statement_list
                        | KEYWORD_ELSE ((OPENPARENTHESIS statement_list CLOSEPARENTHESIS) | statement_list) else_clause?
                        ;

不正确(KEYWORD_ELSE 替代方案中有一个可选的 else_clause)。

应该是:

if_statement            : KEYWORD_IF expression KEYWORD_THEN statement_list else_clause? KEYWORD_ENDIF
                        ;
else_clause             : KEYWORD_ELSE statement_list
                        | KEYWORD_ELSEIF expression KEYWORD_THEN statement_list else_clause?
                        ;

并不是说您不需要 ((OPENPARENTHESIS expression CLOSEPARENTHESIS) | expression) 因为 expression 已经匹配 '(' expression ')'.

但是上述观察结果并不是您问题的原因。真正的问题是你的语法不考虑一元表达式。它与表达式 si__DroneSystem___data_V[this]!=-1 中的 -1 不匹配。

将您的表达式规则更改为:

expression              : OPENPARENTHESIS expression CLOSEPARENTHESIS
                        | OPENBRACKET expression CLOSEBRACKET
                        | func_call
                        | array_ref
                        | function_reference
                        | const_statement
                        | identifier
                        | '+' expression
                        | '-' expression
                        | 'not' expression
                        | expression ('*'|'/') expression
                        | expression ('+'|'-') expression
                        | expression ('>'|'<'|'=='|'!='|'>='|'<=') expression
                        | expression ('and'|'or') expression
                        | identifier
                        ;

现在输入如下:

if this==null then
  return
elseif(si__DroneSystem___data_V[this]!=-1)then
  return
endif

将被解析如下:

enter image description here

关于parsing - 为什么这个表达式没有被正确解析?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15188625/

相关文章:

javascript - fecha.js - 日期/时间,一天中的特定时间

python - 使用 Python 去除和替换高 unicode 字 rune 档的最快方法是什么?

shell - 在命令行上将密码传递给 curl

linux - 使用脚本检查一个 git 分支是否领先于另一个分支

iphone - 我正在学习的 "Objective-C"有多少是通用的 Objective-C,而不是 Apple 的框架?

java - 无法在 TextView 中获得双输出

javascript - 如何解析javascript中的字符串语句?

linux - 需要一个 shell 脚本,bzip2 的每个文件从某个文件夹递归

javascript - 查看 YUI 的源代码并想知道一些事情

programming-languages - 按编程语言列出的顶级存储库