Python RegEx - Negative Lookahead 在 a 之后不起作用?量词

标签 python regex

我是正则表达式的新手,我想找到“po”的所有实例及其变体(即“p.o. | p.o. | p o”)后跟“box”的变体,因为我很感兴趣在采购订单中,而不是在邮政信箱中。下面的代码不起作用,即使它后面跟着一个“框”,它也只是匹配 po。有什么想法吗?

string = " po  pobox  po box  po  box    p.o.  p.o.box  p.o. box  p.o.  box"

re.findall(r' p\.?\s?o\.?(?!\s*box)', string)

//expected output
[' po', ' p.o.']

//actual output
[' po', ' p.o.', ' p.o', ' p.o', ' p.o']

最佳答案

您将先行放置在可选模式之后,回溯使得以另一种方式匹配字符串成为可能。

如果Python支持所有格量​​词,加+就很容易解决了在\.?之后那是在前瞻之前: p\.?\s?o\.?+(?!\s*box) .它会阻止引擎回溯到 \.?模式。

但是,由于 Python re不支持它们,您需要在 o 之后立即移动前瞻,必填部分,并添加\.?向前看:

r'p\.?\s?o(?!\.?\s*box)\.?'
          ^^^^^^^^^^^^^

参见 regex demo .添加\bbox 之后如果您打算将其作为一个整体进行匹配。与第一个相同 p , 你可能想添加一个 \b在匹配 p 之前作为一个整体。

详情

  • p - 一个 p
  • \.? - 一个可选的(1 或 0)点
  • \s? - 一个可选的(1 或 0)空格
  • o - 一个 o
  • (?!\.?\s*box) - 如果在当前位置的右侧有一个可选的点、0+ 个空格和 box,则匹配失败的否定前瞻
  • \.? - 一个可选的(1 或 0)点

关于Python RegEx - Negative Lookahead 在 a 之后不起作用?量词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53402567/

相关文章:

python - 将 dict 的键和值从 str 转换为 Unicode 的最快方法?

python - 为什么我需要带 time() 的 round() 函数?

c# - 正则表达式街道号码分隔符

python - 如何识别Python中不可打印的unicode字符

用于验证 URL 的 javascript jquery 正则表达式

python - 无法在intellij中创建conda env

python - 在类里面调用时出现 pickle 错误

python - 使用 groupby 并申请将列添加到每个组

javascript - 更新正则表达式模式以允许 .xx 而不是 0.xx

c++ - 正则表达式错误。我的正则表达式有什么问题