java - ANTLR 帮助 - 无法解析普通文本，但所有其他更复杂的规则都可以工作

我有一个非常简单的语法 - 它解析用户为各种关键字输入的一堆文本，然后对这些关键字进行字符串替换，同时保留所有其他文本“原样”。

基本上，这个语法应该对大部分文本没有任何作用...它应该只是回显该文本...除非它遇到${...} , $video{...} , $image{...}和$audio{...}

我的语法现在基本上可以工作，但它无法解析像 hey 这样的普通文本使用 chunk 规则，但由于某种原因，它解析 <p>hey</p>使用 block 规则。为什么？我怎样才能让两者都使用chunk规则？

基本上，我希望 CHUNK 捕获其他规则未捕获的所有其他内容。

我对语法进行了一些重构，以使一切变得更加清晰。似乎 everythingElse 与 label 混淆了？我不知道，但是hey不起作用:(

grammar Text;

@header {
}

@members {
    int numberOfVideos = 0;
    StringBuilder builder = new StringBuilder();

    public String getResult() {
        return builder.toString();
    }
}

text
    :   expression*
    ;

expression
    :   fillInTheBlank 
        {
            builder.append($fillInTheBlank.value);
        }
    |   image 
        {
            builder.append($image.value);
        }
    |   video
        {
            builder.append($video.value);
        }
    |   audio
        {
            builder.append($audio.value);
        }
    |   anchor
        {
            builder.append($anchor.value);
        }
    |   everythingElse
        {
            builder.append($everythingElse.value);
        }
    ;

fillInTheBlank returns [String value]
    :   '${' LABEL '}' 
        {
            $value = "<input type=\"text\" id=\"" +
                $LABEL.text +
                "\" name=\"" + 
                $LABEL.text +
                "\" class=\"FillInTheBlankAnswer\" />";
        }
    ;

image returns [String value]
    :   '$image{' URL '}'
        {
            $value = "<img src=\"" + $URL.text + "\" />";
        }
    ;

video returns [String value]
    :   '$video{' URL '}'
        {
            numberOfVideos++;

            StringBuilder b = new StringBuilder();
            b.append("<div id=\"video1\">Loading the player ...</div>\r\n");
            b.append("<script type=\"text/javascript\">\r\n");
            b.append("\tjwplayer(\"video" + numberOfVideos + "\").setup({\r\n");
            b.append("\t\tflashplayer: \"/trainingdividend/js/jwplayer/player.swf\", file: \"");
            b.append($URL.text);
            b.append("\"\r\n\t});\r\n");
            b.append("</script>\r\n");

            $value = b.toString();
        }
    ;

audio returns [String value]
    :   '$audio{' URL '}'
        {
            $value = $URL.text;
        }
    ;   

anchor returns [String value]
    :   URL
        {
            $value = "<a href=\"" + $URL.text + "\">" + $URL.text + "</a>";
        }
    ;   

everythingElse returns [String value]
    :   CHUNK
        {
            $value = $CHUNK.text;
        }
    ;

LABEL
    :   ('a'..'z'|'A'..'Z') ('a'..'z'|'A'..'Z'|'0'..'9')*
    ;
URL
    :   'http://' ('a'..'z'|'A'..'Z'|'0'..'9'|'.'|'/'|'-'|'_'|'%'|'&'|'?')+
    ;
CHUNK
    //: (~('${'|'$video{'|'$image{'|'$audio{'))+
    :   ('a'..'z'|'A'..'Z'|'0'..'9'|'-'|' '|','|'.'|'?'|'\''|':'|'\t'|'\n'|'\r'|'\"'|'>'|'<'|'/'|'_'|'='|';'|'('|')'|'&')+
    ;

我是 antlr 新手 - 使用它大约一天了，所以请不要指望我对它了解很多。

最佳答案

由于空间限制和缺乏格式设置的可能性，我选择这种方式进行回复。所以，无论如何:

不。 CHUNK 和 LABEL 是 Lexer (Scanner) 规则，而 fillInTheBlank 是解析器规则。解析器在扫描器之上运行，也就是说，扫描器不知道解析器(规则)。您必须引入词法分析器状态:

首先，您必须引入一个额外的词法分析器成员来保存状态，告诉您是否要读取标签:

@lexer::members {
    private boolean readLabel = false;
}

然后，您必须为“${”和“}”(我称它们为 BEGIN_VAR 和 END_VAR)引入显式标记定义，以修改此状态变量。此外，只有当 readLabel 为 true 时才能创建 END_VAR token :

BEGIN_VAR
    : '${' { readLabel = true; };

END_VAR : { readLabel }?=> '}' { readLabel = false; };

您还必须告诉词法分析器，LABEL 标记也只能在这种状态下生成:

LABEL
    :   { readLabel }?=> ('a'..'z'|'A'..'Z') ('a'..'z'|'A'..'Z'|'0'..'9')*
    ;

请注意，此定义出现在 CHUNK 之前至关重要。

最后，您必须使用上述标记定义修改 fillInTheBlanks 规则:

fillInTheBlank returns [String value]
    :   BEGIN_VAR LABEL END_VAR 
        { ...

希望这有帮助，似乎对我有用。

关于java - ANTLR 帮助 - 无法解析普通文本，但所有其他更复杂的规则都可以工作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8058179/

java - ANTLR 帮助 - 无法解析普通文本，但所有其他更复杂的规则都可以工作

上一篇：java - java中的动画: paint() and repaint() or threads

下一篇：java - Spring 表单绑定(bind)到 c 内的 Set :forEach