python - 在 python bindings/clang 中的 get-includes 中解析 cpp 文件时过滤目录

标签 python c++ parsing include clang

我应该编写一个 python-clang 解析器,它返回 cpp 文件中的所有内容。 所以我使用如下代码:

def _main():
    from clang.cindex import Index
    from optparse import OptionParser

    filter=['/usr/lib','usr/include']
    p=OptionParser()
    (o,a)=p.parse_args()
    i=Index.create()
    t=i.parse(None,a)
    for i in t.get_includes():
        print i.include

if __name__=='__main__':
    _main()

现在我只需要过滤一些包含物,比如特定目录:

filter=['/usr/lib','usr/include']

问题 1:我想知道这种过滤是如何实现的以及我的代码应该如何更改?

问题 2:如何制作一个配置文件以将所有这些过滤器目录包含在其中,而不是将它们硬编码?

要运行测试:您需要有一个像这样的 cpp 文件:

  #include<iostream>
  #include"ex1.h"

  int main(){
      return 0;
  }

和*.h文件:

 #include<QMap>

运行:

./python-clang.py ex1.cpp

结果样本:

 /usr/include/pthread.h
 /usr/include/sched.h
 /usr/include/time.h
 /usr/include/bits/sched.h
 /usr/include/time.h
 /usr/include/bits/time.h
 /usr/include/signal.h
 /usr/include/bits/sigset.h
 /usr/include/bits/pthreadtypes.h
 /usr/include/bits/wordsize.h
 /usr/include/bits/setjmp.h
 /usr/include/bits/wordsize.h
 /usr/include/bits/wordsize.h
 /usr/include/unistd.h
 /usr/include/bits/posix_opt.h
 /usr/include/bits/environments.h
 /usr/include/bits/wordsize.h
 /usr/include/bits/confname.h
 /usr/include/getopt.h
 /usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/i486-linux-gnu/bits      /atomic_word.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/bits/locale_classes.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/string
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/bits/allocator.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/i486-linux-gnu/bits/c++allocator.h
/usr/lib/gcc/i486-linux-gnu/4.4/../../../../include/c++/4.4/ext/new_allocator.h

最佳答案

您可以在 for 循环中执行此操作:

...
for i in t.get_includes():
    if not i.include in filter:
        print i.include
...

至于包含排除项的配置文件。你可以这样做:

def _main():
    ...
    with open('/path/to/file/ignore.txt') as f:
        filter = f.readlines()
    ...

然后在 ignore.txt 中:

/usr/lib
/usr/include
...

更新

基于您对问题的评论和修改。

def _main():
    ...
    with open('/path/to/file/ignore.txt') as f:
        ignore = map(lambda l: l.strip(), f.readlines())

    for i in t.get_includes():
        if not i.include.startswith(ignore):
            print i.include

这里有几点需要注意。

  1. 自从 filter 以来,我已将变量名称 filter 更改为 ignore 是内置类型。
  2. ignore.txt 中的行将 \n 剥离并映射到 一个 tuple 而不是 list 所以它们可以与 读取时使用startswith方法。
  3. 您还可以使用列表理解来放置过滤的结果 放入列表中以备后用。

results = [i.include for i in t.get_includes() if not i.startswith(ignore)]

关于python - 在 python bindings/clang 中的 get-includes 中解析 cpp 文件时过滤目录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22482209/

相关文章:

python - 圣人中的多元多项式除法

python - 如何使用像 len[arry]-1) 这样的 python 在文本文件中获取最后一行作为索引?

c++ - 如何管理SVG文件中的超出范围的值?

java - 尝试解析具有重复属性名称的 xml

python - 如何在Python中正确使用类装饰器链?

python - 将 session ID 添加到我的 Bokeh 应用程序确实会返回空白页面

c++ - 如何将目录路径转换为唯一的数字标识符 (Linux/C++)?

c++ - 如何在 C++ 中检查符号

c++ - 如何计算 mahadistance 的协变矩阵

android - 根据变量更改单个 ListView 中的文本颜色