algorithm - 如何实现转义

标签 algorithm escaping

前言:我不是在问转义是什么以及如何使用它

假设您编写自己的一种简单的“脚本语言”,或者更确切地说,您只想实现一些神奇的词(变量)。以一种简单的方式(伪语言):

var a = "hello";
var b = "world";
var string = "this is a string with variable $a and $b";
string = string.replace("$a", a).replace("$b", b);

看起来很简单。

现在想象一下,如果有人将“$b”放入a,将会发生的情况是 $a 被替换为“$b”并且“world”在字符串中出现了两次。

此外,如果有人想在文本中按字面意思放置“$a”(不是可变的)怎么办?大多数语言都提供某种转义,我想转义,例如使用反斜杠。因此 "\$a"在最终字符串中会变成 "$a"。

什么是最简单的实现方式(正确)。

我可以想出很多方法来实现这一点,但它们大多非常复杂且效率低下。因此,与其重新发明轮子,我更希望看到一个合适的解决方案。

请不要使用图书馆和中性语言。

最佳答案

您不会“首先替换所有的 $a”,这正是您描述的原因。相反,您从左到右扫描寻找任何替换模式。在所有变量都是单个字母的简单语言中,“替换模式”可能只是一个 $ 后跟一个字符。找到模式后,您就可以找出用哪个变量替换它。替换后,您可以继续处理模板字符串的其余部分。所以一切都只扫描一次。

正则表达式库和扫描仪生成器在这里很方便。许多语言(python、perl、lua、ecmascript 等)都有一个搜索和替换库函数,其搜索参数是一个正则表达式,其替换参数是一个函数;使用匹配的子字符串调用该函数并返回替换字符串。这将涵盖许多简单的语法。

对于更复杂的语法,类 (f)lex 扫描器生成器可以轻松创建转换器,从而允许更通用地实现相同的想法。 (它更通用,因为它不限于使用单个正则表达式。)

这些都与转义无关,因为您不需要转义来避免多次替换。您只需要避免重新扫描。但是,显式转义可以完全相同的方式处理;显式转义语法只是添加到可能的替换模式集中,以及生成替换值的适当操作。 (例如,将 \ 后跟一个特殊字符替换为该字符。)

关于algorithm - 如何实现转义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34466077/

相关文章:

algorithm - MATLAB - 网格特定区域中随机索引的排列

python 将\n as\x0a 传递给 bash 命令行

delphi - 在 Delphi 7 中,如何转义 Format 函数中的百分号 (%)?

php - 转义 SED 命令

algorithm - 在 3 维移动目标上发射射弹(直线轨迹)

algorithm - 谷歌地图多边形优化

javascript - 在javascript中取消转义&符号

javascript - JSON.stringify 不转义?

java - 比 o(n) 更快地计算 a^n 的模数

algorithm - 递归算法中的 Go channel 导致重复值