c# - 语法识别 unlimited '{' expr '}' next to each-other

标签 c# antlr antlr4 grammar

我正在使用 ANTLR4 编写 C# 应用程序认识以下TeX '风格:

{a}{x}+{b}{y}+{c}

我当前的语法总是采用 '{' expr '}' 的最后一个实例,然后忽略字符串的开头。以下是当前语法的一些输出结果(如下所述):

  • 输入: {a} 输出: a [通过]
  • 输入: {a}+{x} 输出: a + x [通过]<
  • 输入: {a}{x} 输出: x [失败] 期望:
  • 输入: {a}{x}+{b} 输出: x + b [失败] 期望: ax + b
  • 输入: {a}{x}+{b}{y} 输出: y [失败] 期望: ax + by
  • 输入: {a}{x}+{b}{y}+{c} 输出: y + c [失败] 期望: ax + by + c
  • 输入: {a}{x}+{b}{y}+{c}{d} 输出: d < strong>[失败] 期望: ax + by + cd

关于如何解决这个问题有什么想法吗?

语法MyGra.g4文件:

/*
 * Parser Rules
 */
prog: expr+ ;

expr : '{' expr '}'                 # CB_Expr
     | expr op=('+'|'-') expr       # AddSub
     | '{' ID '}'                   # CB_ID
     | ID                           # ID
     ;

/*
 * Lexer Rules
 */
ID: ('a' .. 'z' | 'A' .. 'Z')+;
ADD : '+';
SUB : '-';
WS:   (' ' | '\r' | '\n') -> channel(HIDDEN);

MyGraVisitor.CS 文件:

 public override string VisitID(MyGraParser.IDContext context)
 {
      return context.ID().GetText();
 }

 public override string VisitAddSub(MyGraParser.AddSubContext context)
 {
     if (context.op.Type == MyGraParser.ADD)
     {
         return Visit(context.expr(0)) + " + " + Visit(context.expr(1));
     }
     else
     {
         return Visit(context.expr(0)) + " - " + Visit(context.expr(1));
     }
 }

 public override string VisitCB_Expr(MyGraParser.CB_ExprContext context)
 {
     return Visit(context.expr());
 }

 public override string VisitCB_ID(MyGraParser.CB_IDContext context)
 {
     return context.ID().GetText();
 }

更新#1:

建议为

添加语法规则
'{' expr '}{' expr '}'

然而,如果我有 {a}{b}{c}{d}+{e}{f}{g},我认为语法应该解释递归版本通过解析树“本身”……如果我有 1000 个 {expr} 彼此相邻怎么办?那我需要多少条规则?我认为这个建议是有效的,除了我不确定如何解释彼此相邻的无限量的 {expr}?

我的另一个问题是:如何重新使用规则 CB_Expr

更新#2:

我添加了规则:

| expr CB_Expr                  # CB_Expr2

与访客:

public override string VisitCB_Expr2(MyGra.CB_Expr2Context context)
{
    return Visit(context.expr()) + Visit(context.CB_Expr());
}

这没有帮助,我仍然在所有情况下得到相同的输出(如上所述)。

最佳答案

你的语法有歧义。例如:输入 {x} 可以有两个不同的解析树(如 Mephy 所说):

(CB_Expr { (expr (ID x)) })

(DB_ID {x})

删除 CB_ID 可以解决这个问题,而不会造成任何负面影响。

对于你的实际问题,这应该可以解决 expr 问题:

expr : left=id_expr op=('+' |'-') right=expr #AddSub
     | id_expr                               #ID_Expr
     ;

id_expr :
     | '{' ID '}' id_expr                    #ID_Ex
     | '{' ID '}'                            #ID
     ;

虽然我没有测试过这个,我也没有给你写过任何访问者,但语法应该有效。

id_expr 规则以递归方式工作,因此您应该能够根据需要将尽可能多的 {ID} 放在彼此之后 - 至少一个,但语法现在的方式。

关于c# - 语法识别 unlimited '{' expr '}' next to each-other,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32790143/

相关文章:

c# - 没有从派生到基础类的装箱转换

c# - 我如何将数据集的表/对象列表发送到客户端应用程序?

C#:如何防止笔记本电脑进入待机状态

error-handling - Antlr4-如何报告访问者的语义错误

ANTLR4 处理 EOF 时挂起

c# - html 按钮在 html 输入表单中激活 asp 验证 - 为什么?

java - ANTLR toStringTree() 未被识别

c# - 解释 Jint 的工作原理

error-handling - ANTLR : how to extract error messages when build fails

c# - 如何根据 SQL 语法在给定元数据信息和解析树的情况下确定 SQL 语句中的列属于哪个表?