JavaScript 的源映射似乎通常不比 token 粒度更精细。
例如,identity-map uses token granularity .
我知道我看过其他例子,但不记得在哪里。
为什么我们不使用基于 AST 节点的粒度呢?也就是说,如果我们的源 map 有所有 AST 节点的位置,并且只有 AST 节点的起点,那么不利的一面是什么?
在我的理解中,源映射用于崩溃堆栈解码和调试:永远不会有错误位置或有用的断点不在某个 AST 节点的开头,对吧?
更新 1
一些进一步的澄清:
for (const token of tokens) {
generator.addMapping({
source: "source.js",
original: token.location(),
generated: generated.get(token).location(),
});
}
这是在 AST 节点级别添加位置的示例:
for (const node of nodes) {
generator.addMapping({
source: "source.js",
original: node.location(),
generated: generated.get(node).location(),
});
}
更新 2
Q1:为什么期望 AST 节点的启动次数少于代币的启动次数?
A1:因为如果 AST 节点的开始数多于 token 的开始数,那么就会有一个以非 token 开始的 AST 节点。对于解析器的作者来说,这将是一个相当大的成就!为了具体说明,假设您有以下 JavaScript 语句:
const a = function *() { return a + ++ b }
以下是 token 开头的位置:
const a = function *() { return a + ++ b } /*
^ ^ ^ ^^^ ^ ^ ^ ^ ^ ^ ^
*/
这大概是大多数解析器所说的 AST 节点的开始位置。
const a = function *() { return a + ++ b } /*
^ ^ ^ ^ ^ ^ ^
*/
那是 减少 46% 在源 map 位置的数量中!
Q2:为什么期望 AST-Node-granularity source maps 更小?
A2:见上面的 A1
Q3:你会使用什么格式来引用 AST 节点?
A3:没有格式。见 中的示例代码更新 1 以上。我说的是为 AST 节点的开始添加源 map 位置。该过程几乎与为标记开头添加源 map 位置的过程完全相同,只是您要添加的位置更少。
Q4:您如何断言所有处理源映射的工具都使用相同的 AST 表示?
A4:假设我们控制整个管道并且在所有地方都使用相同的解析器。
最佳答案
TypeScript
编译器实际上只在 AST 节点边界上发出源映射位置,但有一些异常(exception)是为了提高与某些工具的兼容性,这些工具期望映射到某些位置,因此基于 token 的映射实际上并不是很通用。在您给出的示例中,TS 的源图适用于如下位置:
const a = function *() { return a + ++ b } /*
^ ^^ ^ ^ ^^ ^ ^^^
*/
它们通常是每个标识符 AST 节点的开始和结束(否则加上开始)。
映射标识符 AST 节点的开始和结束位置的基本原理非常简单 - 当您重命名标识符时,您希望重命名标识符上的选择范围能够映射回原始标识符,而不必依赖启发式。
关于javascript - 为什么 JS 源映射通常以 token 粒度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57690105/