c# - 在文档中查找 HTML 字符串

标签 c# .net html regex

我想获取所有 HTML <p>...</p>在文档中。
使用 Regex使用以下命令查找所有此类字符串:

Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase);

但是我无法得到任何结果。我的正则表达式有什么问题吗?

现在,我只想获取 <p>...</p> 之间的所有内容标记并希望为此使用正则表达式,因为源不是 HTML 文档。

最佳答案

DO NOT PARSE HTML USING Regular Expressions !!!


相反,使用 HTML Agility Pack .

例如:

var doc = new HtmlDocument();
doc.Load(...);

var pTags = doc.DocumentNode.Descendants("p");

编辑:即使文档实际上不是 HTML,您也可以这样做。

关于c# - 在文档中查找 HTML 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2103094/

相关文章:

c# - 如何从视频文件的 "Media Created"列中提取日期?

.net - 如何在 WinDBG 中查看 char 数组中元素的值?

C# WCF 系统.Configuration.ConfigurationErrorsException : Unrecognized element 'ManagedService'

c# - 从(特定)服务器下载 FTP 文件适用于 .NET 4+,但不适用于 .NET 2.0

c# - 如何实现网页的实时数据

c# - 如何确定 C# 中方法参数的适当类型?

c# - DynamoDB for C# 中 SaveAsync 任务的问题

html - 将鼠标悬停在链接上时更改正文背景

html - 如何使 Twitter bootstrap 上的导航栏无响应

html - 使用 VBA 提交网页的问题 - 使用单击按钮功能但网页不会提交