python - python中许多正则表达式的速度

标签 python regex performance

我正在编写一个处理大量字符串/文件的 Python 程序。我的问题是,我将看到一段相当短的文本,我需要在其中搜索相当广泛的单词/短语的实例。

我想我需要编译正则表达式来匹配文本中的这些词/短语。但是,我担心这会花费很多时间。

我的问题是重复编译正则表达式,然后在一小段文本中搜索匹配项的过程有多快?使用一些字符串方法会更好吗?

编辑:所以,我想我的问题的一个例子是:使用一个正则表达式编译和搜索与迭代“if "word"in string”比方说 5 次的代价是多少?

最佳答案

您应该尝试使用 | 运算符将所有正则表达式编译成一个。这样,正则表达式引擎将为您完成大部分优化。使用分组运算符 () 来确定哪个正则表达式匹配。

关于python - python中许多正则表达式的速度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1782586/

相关文章:

python - 如何在 Windows 上使用 Python 的 Protocol Buffer ?

c# - 结合两个正则表达式进行 ASP.NET MVC 数据注释

regex - 在 AWK 的替代例程中使用变量和正则表达式?

sql - 使用OR语句驯服MySQL查询性能时出现问题

sql - 如何将*大*数据 block 导入 PostgreSQL?

performance - Mercurial - HTTPS 还是 SSH?

python - 斯坦福 NER 未标记日期和时间

python - Python 2D 热图中的行数增加

python - 从 pandas where() 中排除列

Java Pattern.quote