c# - 在文档中查找 HTML 字符串

我想获取所有 HTML <p>...</p>在文档中。
使用 Regex使用以下命令查找所有此类字符串:

Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase);

但是我无法得到任何结果。我的正则表达式有什么问题吗？

现在，我只想获取 <p>...</p> 之间的所有内容标记并希望为此使用正则表达式，因为源不是 HTML 文档。

最佳答案

DO NOT PARSE HTML USING Regular Expressions !!!

相反，使用 HTML Agility Pack .

例如:

var doc = new HtmlDocument();
doc.Load(...);

var pTags = doc.DocumentNode.Descendants("p");

编辑:即使文档实际上不是 HTML，您也可以这样做。

关于c# - 在文档中查找 HTML 字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2103094/

相关文章：

c# - 如何从视频文件的 "Media Created"列中提取日期？