我想使用正则表达式从 HTML 源代码中的 html css 链接标记中获取 url
例如
<link rel="apple-touch-icon" href="http://sample.com/icons/apple-touch-icon.png">
有什么帮助吗?
最佳答案
标准响应:不要使用正则表达式来读取 XML,尤其是 HTML。使用 HTML 解析器。
现实的响应:如果您正在使用的输入一致且可预测,那么这可能适合您:
/<link\s+rel="([^"]*)"/
如果输入与您问题中的示例几乎完全不同,这就会中断。以下是无法与正则表达式一起使用的有效 HTML 示例:
<link rel=apple-touch-icon>
<link rel='apple-touch-icon'>
<link href='...' rel='apple'>
<link
rel="apple">
<link rel = "apple">
等等,等等...您可以尝试扩展正则表达式来满足其中一些问题,但您会进入一个充满伤害的世界。
编辑:抱歉,我刚刚注意到您想要 href
。上述内容仍然适用,只需根据需要将 'rel' 替换为 'href' 即可。
关于regex - 正则表达式 rel 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3089591/