我在一个 C 项目中有一个模块,其中包含一堆大源文件和头文件。它们包含许多来自 libc 和同一项目的其他模块的外部头文件。我想收集这些外部头文件实际使用的标识符列表。不仅仅是符号,还有所有外部类型定义、内联函数、宏等。
我想编译一个列表来查看该模块有哪些外部依赖项,这样如果我想将此模块移动到一个完全不同的项目中,我可以看到到底需要移植/重写/丢弃什么。在这种特殊情况下,我对 libc 依赖项不太感兴趣,而是对同一项目的其他模块中的依赖项感兴趣。
我最近得到的就是暂时删除包含指令,如下所示:
sed -i s/"#include <.*>"//g *.c
sed -i s/"#include <.*>"//g *.h
然后使用 -Wno-unused 编译文件,这样我就可以看到由于缺少 header 而导致的错误消息。但它距离易于阅读的外部标识符列表还很远。
最佳答案
这实际上比你想象的更难(特别是因为 preprocessor 像 concatenation 这样的技巧可以构建符号,也因为一些编译器特定的头 - 特别是 <stdarg.h>
- 可能依赖于 GCC 内置或扩展, GCC 接受 asm labels 等..)。
另请注意,编译器可能会执行 optimizations 操作就像改造一个简单的printf
进入puts
(在这种情况下什么名字算数?)...
如果您确实想要什么,您可以自定义 GCC ,例如使用MELT ,以满足您的目的。这可能需要几周的时间。
另一种方法可能是大致解析预处理的形式,收集其中的词汇标记,并对它们进行排序。你可以flex
生成词法分析器,并用 C++(或 Python、Ocaml)或其他语言编写实用程序;但它只会产生所用名称的近似值...如果您想解析 C++ 代码,那就困难得多(命名空间、模板、name mangling ...)。
如果您将自己限制为链接器可见符号,您当然可以使用 nm(1)在目标文件和非剥离可执行文件上。
顺便说一句,GCC 可以处理 -M
preprocessor options自动生成make
依赖关系。
最后,我无法理解你的动机(即使你最新的编辑):如果你有 #include <gtk/gtk.h>
在某些 GUI 应用程序中,您很可能不会使用 GTK 中定义的每个符号或标识符...(同样,您可能不会使用 <stdio.h>
或 <unistd.h>
... 中的每个标识符)。实际上,您很可能不会使用您正在使用的大多数外部库(GTK、sqlite、libcurl,...)提供的所有符号
也许有一些cross-referencing像cxref这样的工具可能有用。
关于c - 如何在 gcc 中列出外部标识符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33234065/