我正在编写一个处理大量字符串/文件的 Python 程序。我的问题是,我将看到一段相当短的文本,我需要在其中搜索相当广泛的单词/短语的实例。
我想我需要编译正则表达式来匹配文本中的这些词/短语。但是,我担心这会花费很多时间。
我的问题是重复编译正则表达式,然后在一小段文本中搜索匹配项的过程有多快?使用一些字符串方法会更好吗?
编辑:所以,我想我的问题的一个例子是:使用一个正则表达式编译和搜索与迭代“if "word"in string”比方说 5 次的代价是多少?
最佳答案
您应该尝试使用 |
运算符将所有正则表达式编译成一个。这样,正则表达式引擎将为您完成大部分优化。使用分组运算符 ()
来确定哪个正则表达式匹配。
关于python - python中许多正则表达式的速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1782586/