c - Ragel 中的字符串插值

标签 c ragel

我正在尝试实现一种语言,我正在使用 Ragel 作为词法分析器(并将 bison 作为解析器)。我希望能够在我的语言中支持字符串插值,但我不确定如何做到这一点。

我的词法分析器对语言的主要部分使用如下所示的扫描器:

sstring = "'" ( ( any -- "'" ) | ( '\\' any ) )* "'";
# dstring = ?;
main := |*
   comment => {};
   '(' => { ADD_TOKEN(LPAREN); };
   ')' => { ADD_TOKEN(RPAREN); };
   # ...
   sstring => { ADD_TOKEN2(STRING); };
   # dstring => ?; 
*|;

我需要做什么才能处理像 "hello #{world}" 这样的字符串插值?

最佳答案

大括号里面的内容可以是一个完整的表达式。内插字符串将转换为串联操作。这对词法分析器来说太多了。您需要解析器的强大功能。因此,在每个内插字符串中识别三种不同类型的标记:

istring_start = "'" ( ( any -- "'" ) | ( '\\' any ) )* "#{";
istring_middle = "}" ( ( any -- "'" ) | ( '\\' any ) )* "#{";
istring_end = "}" ( ( any -- "'" ) | ( '\\' any ) )* "'";

在解析器中你会有这样的规则:

istring : istring_prefix expr ISTRING_END 
                ;
istring_prefix : ISTRING_START
               | istring_prefix expr ISTRING_MIDDLE 
               ;

这些规则构建语法树或编译字节码或任何您想要作为字符串连接操作的代码。

关于c - Ragel 中的字符串插值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19800833/

相关文章:

c - Lua 中是否有等效的 scanf 函数?

c - 文件系统上的 linux-vdso.so.1 在哪里

xml - 如何编写一个简单的 Ragel 分词器(无回溯)?

go - Ragel 转换 Action 和状态 Action 之间的区别

c - 将 for 循环中的值存储到数组中

C:允许将任何数组分配给指向不完整类型数组的指针

c++ - 测试指针的有效性 (C/C++)

Ragel:避免冗余调用 "when"子句函数

c - 为什么 Ragel 执行 to-State 和 From-State 操作两次?

c++ - 使用 Ragel 和 C++ 编译错误