python - 我应该了解 Python 哪些知识才能识别不同源文件中的注释?

标签 python text-manipulation

我需要识别给定目录中不同类型源文件中的注释。 (例如 java、XML、JavaScript、bash)。我决定使用 Python 来做这件事(作为学习 Python 的尝试)。我的问题是

1) 要完成这项工作,我应该了解 python 的哪些知识? (我认为正则表达式会很有用,但是否有替代品/其他有用的模块?我可以用来完成这项工作的库?)

2) Python 是完成此类任务的好选择吗?其他语言是否会让这更容易实现?

最佳答案

您的问题似乎与编程语言解析有关。我相信使用正则表达式,您将能够找到大多数语言的注释。好消息是几乎所有地方都有正则表达式:Perl、Python、Ruby、AWK、Sed 等。

但是,正如其他答案所说,您最好使用一些解析机制。而且,如果不是一个完整的解析器,一个词法分析器。对于 Python,请查看 Pygments库,它有许多已经实现的语言的词法分析器。

关于python - 我应该了解 Python 哪些知识才能识别不同源文件中的注释?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10046665/

相关文章:

m4 - M4 预处理器中的字符串长度

python - 哪个通常更快,产量或附加?

python - beautiful soup 从谷歌搜索中提取一个 href

python - 如何删除 Pandas 数据框中多次出现特定列的行

javascript - 在浏览器中光标的当前位置插入文本

c# - 从字符串中删除 Markdown 标签

python - 禁用 tkinter 小部件的焦点?

python - django 将 DateTimeField 设置为数据库服务器的当前时间

vim - 如何自动计算和更改文本文件(Java 类)中的数字?

emacs - 在 emacs 中移动区域或行