RegEx:如果某个字符在引号内，则不匹配它

披露:我已阅读 this answer很多次在这里，我知道比使用正则表达式来解析 HTML 更好。这个问题只是为了扩大我对正则表达式的了解。

说我有这个字符串:

some text <tag link="fo>o"> other text

我想匹配整个标签，但如果我使用 <[^>]+>它只匹配 <tag link="fo> .

我如何确保 >引号内可以忽略。

我可以轻松地编写一个带有 while 循环的解析器来执行此操作，但我想知道如何使用正则表达式来执行此操作。

最佳答案

正则表达式:

<[^>]*?(?:(?:('|")[^'"]*?\1)[^>]*?)*>

在线演示:

http://regex101.com/r/yX5xS8

完整说明:

我知道这个正则表达式可能让人头疼，所以这是我的解释:

<                      # Open HTML tags
    [^>]*?             # Lazy Negated character class for closing HTML tag
    (?:                # Open Outside Non-Capture group
        (?:            # Open Inside Non-Capture group
            ('|")      # Capture group for quotes, backreference group 1
            [^'"]*?    # Lazy Negated character class for quotes
            \1         # Backreference 1
        )              # Close Inside Non-Capture group
        [^>]*?         # Lazy Negated character class for closing HTML tag
    )*                 # Close Outside Non-Capture group
>                      # Close HTML tags

关于RegEx:如果某个字符在引号内，则不匹配它，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22164374/

上一篇：ruby-on-rails - ActiveAdmin 和就地编辑

下一篇：angularjs - $TemplateCache 或 TemplateUrl 用于指令

相关文章：

c++ - 正则表达式是否足以分析大文本？

php - preg_replace vs ereg_replace vs str_replace 在这个特殊情况下

javascript - 在 Javascript 变量中转义引号的通用方法

Perl 命令行脚本和 shell 变量 : How to quote?

bash - Linux CRON : unexpected EOF while looking for matching `` '

string - 为什么 jq --raw-output 参数无法从 @csv 输出中删除引号？

java - 为什么不呢？在此模式中充当可选的重复说明符？

正则表达式匹配多个点

sql - 如何使用 SQL 替换字符串末尾的子字符串？

linux - 双引号在别名中转义