我想浏览给定项目中所有可用的 Java(或任何其他语言)源代码,并且:
- 建立关键字排列及其关系的统计分布
- 从中挑选出重复的序列字符、结构(模式)。
您会向我推荐什么样的工具集?
例如:
我希望它能够选择:
* ( * ) {
*
}
出
public static void main ( String[] args ) {
System.err.println( "Specific Text" );
}
或
\n;
出于
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
最佳答案
您需要一个语言解析器。我能想到的正确的一个是http://www.antlr.org/ 。您最终会使用 Java 已有的语法并解析文件并查找标记。例如,if、for、when 等...都是解析器会告诉您的关键字。但 123 不是关键字。
关于java - 分析代码语法的工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5156882/