我是 ANTLR 的初学者,我需要修改现有的复杂语法。
我想创建一个规则来保留一个 block 而不用其他规则进行解析。 为了更清楚,我需要将用 C++ 编写的代码插入到解释代码中。
编辑 11/02/2013
经过多次测试,这是我的语法,我的测试,我得到的结果,以及结果和想要的:
语法
cppLiteral
: cppBegin cppInnerTerm cppEnd
;
cppBegin
: '//$CPP_IN$'
;
cppEnd
: '//$CPP_OUT$'
;
cppInnerTerm
: ( ~('//$CPP_OUT$') )*
;
测试
//$CPP_IN$
txt1 txt2
//$CPP_OUT$
结果
cppLiteral ->
cppBegin = '//$CPP_IN$'
cppInnerTerm = 'txt1' 'txt2'
cppEnd = '//$CPP_OUT$'
预期结果
cppLiteral ->
cppBegin = '//$CPP_IN$'
cppInnerTerm = 'txt1 txt2'
cppEnd = '//$CPP_OUT$'
(抱歉,我没有 10 个声望,所以无法发布 AST 的图像)
“cppBegin”、“cppInnerTerm”和“cppEnd”三个标记可以在一个标记中,如下所示:
cppLiteral
: '//$CPP_IN$'( ~('//$CPP_OUT$') )*'//$CPP_OUT$'
;
得到这个结果:
cppLiteral = '//$CPP_IN$\n txt1 txt2\n //$CPP_OUT$'
最佳答案
I want to create a rule to keep a block without parsing with other rules.
像多行注释一样解析它,例如/* foobar */
。下面是一个使用您问题中指定的关键字的小示例。
请注意,大部分工作都是使用词法分析器规则(以大写字母开头的规则)完成的。任何时候你想处理文本 block ,特别是如果你想避免其他规则,就像在这种情况下,你可能会考虑词法分析器规则而不是解析器规则。
CppBlock.g
grammar CppBlock;
document: CPP_LITERAL* EOF;
fragment CPP_IN:'//$CPP_IN$';
fragment CPP_OUT:'//$CPP_OUT$';
CPP_LITERAL: CPP_IN .* CPP_OUT
{
String t = getText();
t = t.substring(10, t.length() - 11); //10 = length of CPP_IN, 11 = length of CPP_OUT
setText(t);
}
;
WS: (' '|'\t'|'\f'|'\r'|'\n')+ {skip();};
这是一个简单的测试用例:
输入
//$CPP_IN$
static const int x = 0; //magic number
int *y; //$CPP_IN$ <-- junk comment
static void foo(); //forward decl...
//$CPP_OUT$
//$CPP_IN$
//Here is another block of CPP code...
const char* msg = ":D";
//The end.
//$CPP_OUT$
输出 token
[CPP_LITERAL :
static const int x = 0; //magic number
int *y; //$CPP_IN$ <-- junk comment
static void foo(); //forward decl...
]
[CPP_LITERAL :
//Here is another block of CPP code...
const char* msg = ":D";
//The end.
]
规则 CPP_LITERAL
在输入的开头和结尾保留换行符(在 //$CPP_IN$
之后和 //$CPP_OUT$
之前).如果您不想要这些,只需更新操作以将其删除。否则,我认为这个语法可以满足您的要求。
关于c++ - ANTLR - 保持 block 不变,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14583843/