c - 如何为错误创建语法规则?

标签 c compiler-construction bison

我正在用 C 编写一个编译器,我使用 bison 作为语法,使用 flex 作为标记。为了提高错误消息的质量,一些常见的错误需要出现在语法中。然而,这有副作用, Bison 认为无效输入实际上是有效的。

例如,考虑这个语法:

program
  : command ';' program
  | command ';'
  | command {yyerror("Missing ;.");} // wrong input
  ;
command
  : INC
  | DEC
  ;

其中INCDEC是代币,program是初始符号。在这种情况下,INC; 是一个有效的程序,但 INC 不是,并且会生成一条错误消息。然而,函数 yyparse() 返回 0,就好像程序是正确的。

查看 bison 手册,我发现了宏 YYERROR,它的行为应该就像解析器本身发现错误一样。但是即使我在调用 yyerror() 之后添加了 YYERROR,函数 yyparse() 仍然返回 0。我可以使用 YYABORT 而不是,但这会在第一个错误时停止,这很糟糕,不是我想要的。

有没有办法让 yyparse() 返回 1 而不会在出现第一个错误时停止?

最佳答案

由于您打算从语法错误中恢复,因此您将无法使用 yyparse 的返回码来表示发生了一个或多个错误。相反,您必须自己跟踪该信息。

这样做的传统方法是使用全局错误计数(只显示关键部分):

%{
    int parse_error_count = 0;
%}
%%
program: statement { yyerror("Missing semicolon");
                     ++parse_error_count; }
%%
int parse_interface() {
  parse_error_count = 0;
  int status = yyparse();
  if (status) return status;        /* Might have run out of memory */
  if (parse_error_count) return 3;  /* yyparse returns 0, 1 or 2 */
  return 0;
}

一个更现代的解决方案是为 yyparse 定义一个额外的“out”参数:

%parse-param { int* error_count }
%%
program: statement { yyerror("Missing semicolon");
                     ++*error_count; }
%%
int main() {
  int error_count = 0;
  int status = yyparse(&error_count);
  if (status || error_count) { /* handle error */ }

最后,如果您确实需要从 bison 生成的代码中导出符号 yyparse,您可以执行以下丑陋的 hack:

%code top {
#define yyparse internal_yyparse
}
%parse-param { int* error_count }
%%
program: statement { yyerror("Missing semicolon");
                     ++*error_count; }
%%
#undef yyparse
int yyparse() {
  int error_count = 0;
  int status = internal_yyparse(&error_count);
  // Whatever you want to do as a summary
  return status ? status : error_count ? 1 : 0;
}

关于c - 如何为错误创建语法规则?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29267595/

相关文章:

c - Windows 上的 ANSI C 文件权限?

parsing - LL(1) 文法。有自递归规则怎么计算follow set?

c - C 中带有通配符的目录列表

c - 在线编译器是否在其服务器上生成 a.out/exe 文件?

c++ - "Universal character name conversion"在 C++ 中是什么意思?

c - bison输出文件编译时 `main'的多重定义

c - 如何将$$、$1、$2...bison伪变量的类型改为GMP变量

c - 在非终端 Bison 规则之间传递多个值

c - MPI 杀死不需要的进程

c - 使用环形缓冲区和 pthread 的生产者 - 消费者