regex - 捕获不属于链接的特定单词的所有出现

我正在尝试使用 PCRE2 方言从 HTML 文本中获取所有出现的单词“apple”的正则表达式。但不包括当苹果这个词是链接的一部分时。
我是 Regex 的初学者，可能我犯了一个很简单的错误。

\bapple\b

因此，以下文本必须匹配第一个匹配项，而不是第二个和第三个匹配项。

Lorem ipsum apple sit amet, consectetur <a href="#">apple</a> elit <a href="/test/apple">lorem</a>.

我做错了什么？

最佳答案

在 PCRE 中，你可以使用这个正则表达式:

~(?is)<a .*?</a>(*SKIP)(*F)|\bapple\b~

正则表达式详细信息:

关于regex - 捕获不属于链接的特定单词的所有出现，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66075884/

相关文章：

javascript - 正则表达式查找句子中的最后一个单词