python - 代码的行分析器是否需要解析树,这就足够了吗?

标签 python r language-agnostic profiling parse-tree

我正在尝试确定为一种语言(例如可用于 Python 和 Matlab 的语言)编写线路分析器的必要条件。

解释“行分析器”的一种天真的方法是假设可以在每一行周围插入时间记录,但行的定义取决于解析器如何处理空白,这只是第一个问题。似乎需要使用解析树并在各个节点周围插入时序。

这个结论正确吗?线路分析器是否需要解析树,是否仅此而已(除了时间记录之外)?


更新 1:提供赏金,因为问题仍未解决。

更新 2:这是一个众所周知的链接 Python line profiler以防对回答这个问题有帮助。我还不能完全了解它与解析相关的行为。恐怕无法访问 Matlab 探查器的代码。

另请注意,可以说手动修饰输入代码将消除对解析树的需求,但这不是自动分析器。

更新 3:虽然这个问题与语言无关,但这是因为我正在考虑为 R 创建这样一个工具(除非它存在但我还没有找到它)。

更新 4:关于线路分析器与调用堆栈分析器的使用 - this post与使用调用堆栈分析器(Rprof() 在这种情况下)相关的例子说明了为什么使用调用堆栈而不是通过线路分析器直接分析事物会很痛苦。

最佳答案

我会说是的,您需要一个解析树(和源代码)——否则您怎么知道什么构成了“行”和有效语句?

实际的简化可能是“语句分析器”而不是“行分析器”。 在 R 中,解析树很容易获得:body(theFunction) , 因此在每个语句周围插入测量代码应该相当容易。通过更多的工作,您可以将它插入属于同一行的一组语句周围。

在 R 中,从文件加载的函数体通常也有一个属性 srcref列出每个“行”(实际上是每个语句)的来源:

这是一个示例函数(放在“example.R”中):

f <- function(x, y=3)
{
    a <- 0; a <- 1  # Two statements on one line
    a <- (x + 1) *  # One statement on two lines
        (y + 2)

    a <- "foo       
        bar"        # One string on two lines
}

然后在 R 中:

source("example.R")
dput(attr(body(theFunction), "srcref"))

打印此行/列信息:

list(structure(c(2L, 1L, 2L, 1L, 1L, 1L, 2L, 2L), srcfile = <environment>, class = "srcref"), 
    structure(c(3L, 2L, 3L, 7L, 9L, 14L, 3L, 3L), srcfile = <environment>, class = "srcref"), 
    structure(c(3L, 10L, 3L, 15L, 17L, 22L, 3L, 3L), srcfile = <environment>, class = "srcref"), 
    structure(c(4L, 2L, 5L, 15L, 9L, 15L, 4L, 5L), srcfile = <environment>, class = "srcref"), 
    structure(c(7L, 2L, 8L, 6L, 9L, 20L, 7L, 8L), srcfile = <environment>, class = "srcref"))

如您所见(每个结构中的最后两个数字是开始/结束行),表达式 a <- 0a <- 1映射到同一行...

祝你好运!

关于python - 代码的行分析器是否需要解析树,这就足够了吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7309890/

相关文章:

python - a(* {'q' :'qqq' }),为什么只打印 key

algorithm - 有没有找到第k大元素的 "tournament"算法?

algorithm - 根据人们的首选列表为人们分配他们最喜欢的值的算法是什么?

r - 使用 extrafont 将字体导入 R 时,如何解决 "No Font Name"问题?

r - 使用 data.table 进行过滤以仅保留一对一匹配

R:使用 geom_line 访问函数内的列名

python - 从函数返回多个值的优雅方法

python - 从 BVH 文件中提取数据并将其应用于我的 3d 模型?

python - Pandas : finding out wrong data

python - Pandas 避免重复求和