terminology - 在编译器构造中，符号是否与标记相同？

在编译器构造中，当您谈论 token 时， token 是否与符号相同/只是符号的另一个术语？经过一些研究，我想明白了， token 是一个引用符号表的符号，因此某种属性符号/带有一些附加信息的符号？感谢您的任何澄清:-)

最佳答案

token 不一定是符号表中的符号。
例如，如果一个标记是一个保留字，那么它就不会被输入到符号表中。如果 token 是标识符，那么它很可能会被输入到符号表中。

以下面的声明为例:

char s[100];

词法分析器可以输出以下标记:

<"char", IDENTIFIER>

根据实现，它可以被识别为保留字或作为预定义的类型名称输入符号表中(我在这里不是 100% 确定)，

<"s", IDENTIFIER>

“s”作为变量标识符输入符号表，

<"[", OPEN_SQUARE_BRACKET>

未输入符号表，

<"100", INTEGER_LITERAL>

未输入符号表，

<"]", CLOSE_SQUARE_BRACKET>

未输入符号表，

<";", SEMI_COLON>

未输入符号表。

因此，您基本上只在符号表中输入您稍后在编译过程中需要引用的那些标记。例如，稍后在函数体中，当您发现

strcpy(s, "Hello, world\n");

您再次识别标记 <"s", IDENTIFIER> 并在符号表中查找它。符号表会说“s”已被声明为 char [] 类型的变量。

所以，我会说 token 是词法分析器识别的任何输入块，并且仅输入具有特殊含义的某些标记作为符号在符号表中。

关于terminology - 在编译器构造中，符号是否与标记相同？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6872865/