我是正则表达式的新手,我想找到“po”的所有实例及其变体(即“p.o. | p.o. | p o”)后跟“box”的变体,因为我很感兴趣在采购订单中,而不是在邮政信箱中。下面的代码不起作用,即使它后面跟着一个“框”,它也只是匹配 po。有什么想法吗?
string = " po pobox po box po box p.o. p.o.box p.o. box p.o. box"
re.findall(r' p\.?\s?o\.?(?!\s*box)', string)
//expected output
[' po', ' p.o.']
//actual output
[' po', ' p.o.', ' p.o', ' p.o', ' p.o']
最佳答案
您将先行放置在可选模式之后,回溯使得以另一种方式匹配字符串成为可能。
如果Python支持所有格量词,加+
就很容易解决了在\.?
之后那是在前瞻之前: p\.?\s?o\.?+(?!\s*box)
.它会阻止引擎回溯到 \.?
模式。
但是,由于 Python re
不支持它们,您需要在 o
之后立即移动前瞻,必填部分,并添加\.?
向前看:
r'p\.?\s?o(?!\.?\s*box)\.?'
^^^^^^^^^^^^^
参见 regex demo .添加\b
在 box
之后如果您打算将其作为一个整体进行匹配。与第一个相同 p
, 你可能想添加一个 \b
在匹配 p
之前作为一个整体。
详情
-
p
- 一个p
-
\.?
- 一个可选的(1 或 0)点 -
\s?
- 一个可选的(1 或 0)空格 -
o
- 一个o
-
(?!\.?\s*box)
- 如果在当前位置的右侧有一个可选的点、0+ 个空格和box
,则匹配失败的否定前瞻 -
\.?
- 一个可选的(1 或 0)点
关于Python RegEx - Negative Lookahead 在 a 之后不起作用?量词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53402567/