<分区>
我正在尝试为 vera++ 静态分析器编写规则。由于我在这里没有找到 vera++ 的组,并且 vera++ 使用 TCL 来实现其分析规则,因此我发布到 TCL 论坛。我曾在 vera++ inspirel.com/vera/ce/doc/tclapi.html 上工作,但由于我不太了解 TCL,所以我希望获得进一步的建议。
由于我是 TCL 编程的初学者,但想知道 TCL 程序在 C++ 源代码文件中列出所有局部变量的方法?我的意思是什么方法以及如何实现?
我面临的问题是在解析 C++ 源代码文件以检测局部变量声明时?
使用 vera++ 规则解析局部(或任何其他)变量定义非常复杂,但当然可行。基本的 C++ 解析和标记化由 vera++ 完成。
基本方法是使用vera++的getTokens
功能与检查完整的 C++ 语句的小状态机结合使用。您需要收集标记(可能还包括它们的值,因为稍后您将需要变量名来设置列表)并将它们连接起来,直到您有一个完整的语句。如果您有完整的语句,您可以使用正则表达式来检查它是否是变量定义并从子匹配中提取变量名称。你还需要记住你是否在 {}
中。 block 以了解它是否是局部变量定义。
您可以在 vera++ 的规则 T019 中找到一个示例,用于构建一个简单的状态机来收集语句的标记,该规则检查完整的花括号代码块,以此作为起点。
我已经使用 vera++ 解析变量定义(以检查各种命名约定),但遗憾的是无法发布完整代码,因为它是我雇主的专有工作。但我可以给你一个片段,显示我用来检查变量声明的正则表达式:
set isVar false
if [regexp {\s+((extern\s+)?(static\s+|mutable\s+|register\s+|volatile\s+)?(const\s+)?)?((identifier#[^#]+#\s+colon_colon\s+)*identifier#[^#]+#)\s+(star\s+|const\s+|and\s+|less.*greater\s+|greater\s+)*(identifier#[^#]+#\s+colon_colon\s+)*identifier#([^#]+)#(\s+leftbracket.*rightbracket)?(\s+assign)?.*semicolon$} $statement m s1 s2 s3 s4 s5 s6 s7 s8 s9 s10] {
set locVarname $s9
set isVar true
set currentMatch $m
} elseif [regexp {\s+((extern\s+)?(static\s+|mutable\s+|register\s+|volatile\s+)?(const\s+)?)?(char\s+|int\s+|short\s+|long\s+|void\s+|bool\s+|double\s+|float\s+|unsigned\s+|and\s+|star\s+|unsigned\s+)+(identifier#[^#]+#\s+colon_colon)*\s+identifier#([^#]+)#(\s+leftbracket.*rightbracket)?(\s+assign)?.*semicolon$} $statement m s1 s2 s3 s4 s5 s6 s7 s8] {
set locVarname $s7
set isVar true
set currentMatch $m
}
$statement
包含前面提到的完整语句。请注意,我将 token 值连接到 identifier
token 使用 identifier#<value>#
并使用正则表达式组来提取它。