我需要识别给定目录中不同类型源文件中的注释。 (例如 java、XML、JavaScript、bash)。我决定使用 Python 来做这件事(作为学习 Python 的尝试)。我的问题是
1) 要完成这项工作,我应该了解 python 的哪些知识? (我认为正则表达式会很有用,但是否有替代品/其他有用的模块?我可以用来完成这项工作的库?)
2) Python 是完成此类任务的好选择吗?其他语言是否会让这更容易实现?
最佳答案
您的问题似乎与编程语言解析有关。我相信使用正则表达式,您将能够找到大多数语言的注释。好消息是几乎所有地方都有正则表达式:Perl、Python、Ruby、AWK、Sed 等。
但是,正如其他答案所说,您最好使用一些解析机制。而且,如果不是一个完整的解析器,一个词法分析器。对于 Python,请查看 Pygments库,它有许多已经实现的语言的词法分析器。
关于python - 我应该了解 Python 哪些知识才能识别不同源文件中的注释?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10046665/