如何使用 C# 正则表达式替换/删除所有 HTML 标记,包括尖括号? 有人可以帮我处理代码吗?
最佳答案
如前所述,您不应该使用正则表达式来处理 XML 或 HTML 文档。它们在 HTML 和 XML 文档中表现不佳,因为无法以通用方式表达嵌套结构。
您可以使用以下内容。
String result = Regex.Replace(htmlDocument, @"<[^>]*>", String.Empty);
这适用于大多数情况,但在某些情况下(例如包含尖括号的 CDATA),这将无法按预期工作。
关于c# - 使用 C# 正则表达式去除 HTML 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/787932/