c# - 使用 C# 正则表达式去除 HTML 标签

标签 c# html regex parsing

如何使用 C# 正则表达式替换/删除所有 HTML 标记,包括尖括号? 有人可以帮我处理代码吗?

最佳答案

如前所述,您不应该使用正则表达式来处理 XML 或 HTML 文档。它们在 HTML 和 XML 文档中表现不佳,因为无法以通用方式表达嵌套结构。

您可以使用以下内容。

String result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty);

这适用于大多数情况,但在某些情况下(例如包含尖括号的 CDATA),这将无法按预期工作。

关于c# - 使用 C# 正则表达式去除 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/787932/

相关文章:

regex - 基于正则表达式的递归查找和替换

c# - 在 ALT+TAB 中显示任务,但不在任务栏中显示

c# - 灯具对属性自动生成的约束

c# - Log4Net 从多个进程写入文件

php - HTML5 和 PHP : Get & Convert MONTH Input Type Value into STRING and Minus One Month From Input Value

java - 使用compareTo() 对电子邮件地址进行排序会返回意外结果

JavaScript 正则表达式 : find GUID in an URL and replace it

c# - 使用 LockBits 复制位图的矩形部分

javascript - 如何在使用 jquery 重置 html 表单后执行代码?

javascript - 在 HTML5 canvas 准备就绪时调用函数