我有一个下载程序,可以从 Internet 下载页面。
每个页面的编码都不一样,有的是UTF-8,有的是Unicode。
例如:a
显示 'a' 字符;充满这些字符的页面。我们应该将这种编码转换为普通文本。
我在 c# 中使用了 UnicodeEncoding
类,但它们对我没有帮助。
如何将此编码解码为真实字符?是否有转换它的类或方法?
谢谢。
最佳答案
那是html编码的;尝试 HtmlDecode ? (您需要引用 System.Web.dll)
关于c# - 如何将 UTF-8 转换为 HTML 实体中的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3028344/