regex - 正则表达式 rel 标签

标签 regex

我想使用正则表达式从 HTML 源代码中的 html css 链接标记中获取 url

例如

<link rel="apple-touch-icon" href="http://sample.com/icons/apple-touch-icon.png">

有什么帮助吗?

最佳答案

标准响应:不要使用正则表达式来读取 XML,尤其是 HTML。使用 HTML 解析器。

现实的响应:如果您正在使用的输入一致可预测,那么这可能适合您:

/<link\s+rel="([^"]*)"/

如果输入与您问题中的示例几乎完全不同,这就会中断。以下是无法与正则表达式一起使用的有效 HTML 示例:

<link rel=apple-touch-icon>
<link rel='apple-touch-icon'>
<link href='...' rel='apple'>
<link
   rel="apple">
<link rel = "apple">

等等,等等...您可以尝试扩展正则表达式来满足其中一些问题,但您会进入一个充满伤害的世界。

编辑:抱歉,我刚刚注意到您想要 href。上述内容仍然适用,只需根据需要将 'rel' 替换为 'href' 即可。

关于regex - 正则表达式 rel 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3089591/

相关文章:

javascript - 当作为字符串传入时,为什么这个 RegExp 不起作用?

java - 使用正则表达式捕获数字

regex - unix egrep 不匹配某个组

c# - 删除自定义标记需要正则表达式

java - 正则表达式中的匹配字符 * (Java)

php - MYSQL子查询和正则表达式

javascript - 如何替换JS字符串中的所有\"?

javascript - RegEx 使用 RegExp.exec 从字符串中提取所有匹配项

javascript - 正则表达式 - 如何选择所有双斜杠,但后跟冒号

regex - NGINX - 正则表达式 - 搜索非字母数字的整个位置