c# - 如何将 UTF-8 转换为 HTML 实体中的文本?

标签 c# encoding utf-8 html-entities

我有一个下载程序,可以从 Internet 下载页面。 每个页面的编码都不一样,有的是UTF-8,有的是Unicode。 例如:a 显示 'a' 字符;充满这些字符的页面。我们应该将这种编码转换为普通文本。

我在 c# 中使用了 UnicodeEncoding 类,但它们对我没有帮助。

如何将此编码解码为真实字符?是否有转换它的类或方法?

谢谢。

最佳答案

那是html编码的;尝试 HtmlDecode ? (您需要引用 System.Web.dll)

关于c# - 如何将 UTF-8 转换为 HTML 实体中的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3028344/

相关文章:

java - HashMap破坏编码?

c# - 避免通过 httpmodules 在 asp.net mvc2 中使用跨站点脚本

c# - 如何替换文本中的字符颜色?

c# - 什么时候评估闭包中的属性?

c# - WPF - DataGrid 仅显示基类的属性

java - 从 javascript 转义 Unicode 到 Java Unicode 的转换

java - JSF2 Form 到 DB 特殊字符处理

matlab - 将unicode字符串写入Matlab中的文件

encoding - ClickHouse:在用作 bool 值的 Uint8 上使用 LowCardinality 字段是否有意义?

java - 如果我从文件中读取,如何将 ASCII(Unicode Escaped)中的字符串转换为 Unicode(UTF-8)?