我想获取所有 HTML <p>...</p>
在文档中。
使用 Regex
使用以下命令查找所有此类字符串:
Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase);
但是我无法得到任何结果。我的正则表达式有什么问题吗?
现在,我只想获取 <p>...</p>
之间的所有内容标记并希望为此使用正则表达式,因为源不是 HTML 文档。
最佳答案
DO NOT PARSE HTML USING Regular Expressions !!!
相反,使用 HTML Agility Pack .
例如:
var doc = new HtmlDocument();
doc.Load(...);
var pTags = doc.DocumentNode.Descendants("p");
编辑:即使文档实际上不是 HTML,您也可以这样做。
关于c# - 在文档中查找 HTML 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2103094/