我下载了一个编码为“usa-ascii”的页面,但我得到了错误的字符。为什么??
WebClient wb = new WebClient();
Encoding enc = Encoding.GetEncoding("US-ASCII");
wb.Encoding = enc;
byte[] by = wb.DownloadData(link);
string htmlDoc = enc.GetString(by);
但我得到的是:Pr?z 而不是:Präz。
我的 HTML link : (charest=us-ascii)
<html debug="true">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii"/>
</head>
...................
怎么了???
附注我尝试编码为 utf-8,但它也不起作用。
最佳答案
US-ASCII 没有该字符,因此页面包含无效字符(对于定义的字符集)。您的代码没有错,问题是 US-ASCII 不能满足 ä
这样的字符。
US-ASCII 数据表:link
关于c# - 通过 webclient 下载具有正确编码的 html 页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10698648/