前言:我不是在问转义是什么以及如何使用它
假设您编写自己的一种简单的“脚本语言”,或者更确切地说,您只想实现一些神奇的词(变量)。以一种简单的方式(伪语言):
var a = "hello";
var b = "world";
var string = "this is a string with variable $a and $b";
string = string.replace("$a", a).replace("$b", b);
看起来很简单。
现在想象一下,如果有人将“$b”放入a
,将会发生的情况是 $a 被替换为“$b”并且“world”在字符串中出现了两次。
此外,如果有人想在文本中按字面意思放置“$a”(不是可变的)怎么办?大多数语言都提供某种转义,我想转义,例如使用反斜杠。因此 "\$a"在最终字符串中会变成 "$a"。
什么是最简单的实现方式(正确)。
我可以想出很多方法来实现这一点,但它们大多非常复杂且效率低下。因此,与其重新发明轮子,我更希望看到一个合适的解决方案。
请不要使用图书馆和中性语言。
最佳答案
您不会“首先替换所有的 $a
”,这正是您描述的原因。相反,您从左到右扫描寻找任何替换模式。在所有变量都是单个字母的简单语言中,“替换模式”可能只是一个 $ 后跟一个字符。找到模式后,您就可以找出用哪个变量替换它。替换后,您可以继续处理模板字符串的其余部分。所以一切都只扫描一次。
正则表达式库和扫描仪生成器在这里很方便。许多语言(python、perl、lua、ecmascript 等)都有一个搜索和替换库函数,其搜索参数是一个正则表达式,其替换参数是一个函数;使用匹配的子字符串调用该函数并返回替换字符串。这将涵盖许多简单的语法。
对于更复杂的语法,类 (f)lex 扫描器生成器可以轻松创建转换器,从而允许更通用地实现相同的想法。 (它更通用,因为它不限于使用单个正则表达式。)
这些都与转义无关,因为您不需要转义来避免多次替换。您只需要避免重新扫描。但是,显式转义可以完全相同的方式处理;显式转义语法只是添加到可能的替换模式集中,以及生成替换值的适当操作。 (例如,将 \ 后跟一个特殊字符替换为该字符。)
关于algorithm - 如何实现转义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34466077/