c# - 如何从 ASP.NET 中的字符串中去除 HTML 标签？

使用 ASP.NET，我如何可靠地从给定字符串中去除 HTML 标记(即不使用正则表达式)？我正在寻找类似 PHP 的 strip_tags 的东西.

<ul><li>Hello</li></ul>

“你好”

我尽量不重新发明轮子，但到目前为止我还没有找到满足我需求的东西。

最佳答案

如果它只是从字符串中剥离所有 HTML 标记，这对于正则表达式也可靠有效。替换:

<[^>]*(>|$)

全局为空字符串。之后不要忘记规范化字符串，替换:

[\s\r\n]+

用一个空格，并修剪结果。可选择将任何 HTML 字符实体替换回实际字符。

注意:

关于c# - 如何从 ASP.NET 中的字符串中去除 HTML 标签？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/785715/

相关文章：

jquery - 选中的 block 只需要在滚动时固定在顶部