我编写了一个正则表达式来从 HTML 中获取字符串,但多行标志似乎不起作用。
这是我的模式,我想获取 h1
标记中的文本。
var pattern= /<div class="box-content-5">.*<h1>([^<]+?)<\/h1>/mi
m = html.search(pattern);
return m[1];
我创建了一个字符串来测试它。当字符串包含“\n”时,结果始终为空。如果我删除了所有的“\n”,它给了我正确的结果,不管有没有 /m
标志。
我的正则表达式有什么问题?
最佳答案
您正在寻找 /.../s
修饰符,也称为 dotall 修饰符。它强制点 .
也匹配换行符,默认情况下它不这样做。
坏消息是它在 JavaScript 中不存在 (它在 ES2018 中存在,见下文)。好消息是您可以通过同时使用字符类(例如 \s
)及其否定(\S
)来解决它,如下所示:
[\s\S]
所以在你的情况下,正则表达式会变成:
/<div class="box-content-5">[\s\S]*<h1>([^<]+?)<\/h1>/i
从 ES2018 开始,JavaScript 支持 s
(dotAll) 标志,因此在现代环境中,您的正则表达式可能与您编写的一样,但带有 s
标志最后(而不是 m
;m
改变 ^
和 $
的工作方式,而不是 。
):
/<div class="box-content-5">.*<h1>([^<]+?)<\/h1>/is
关于两个标签之间的 JavaScript 正则表达式多行文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1068280/