c# - HtmlAgility :no contents appeared (C#, UWP)

标签 c# html win-universal-app uwp html-agility-pack

我尝试使用 htmlagilitypack 来解析表格,完成后我意识到我忘记证明 htmlagility 部分是否有效。 ... 很明显它不起作用 我也不知道我错过了什么,我在哪里做错了...... 因为我是初学者... 所以请不要对我太苛刻。

public partial class WebForm1 : System.Net.Http.HttpClient
{
    protected void Page_Load(object sender, EventArgs e)
    {

        System.Net.Http.HttpClient httpClient = new System.Net.Http.HttpClient();

        string header = "ie";
        if (!headers.UserAgent.TryParseAdd(header))
        {
            throw new Exception("Invalid header value: " + header);
        }

        header = "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0)";
        if (!headers.UserAgent.TryParseAdd(header))
        {
            throw new Exception("Invalid header value: " + header);
        }

        HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();


        htmlDoc.LoadHtml(" http://www.eurogymnasium-waldenburg.de/egw_content/Stunden_Vertretungsplan/home.html");



        HtmlNode docNodes = htmlDoc.DocumentNode;

        HtmlNode navNode = htmlDoc.GetElementbyId("bereichaktionen");

        HtmlNode docNode = htmlDoc.DocumentNode.SelectSingleNode("/html/body[@class='ui-widget']/div[@id='main']/div[@id='vplan']/div[@id='bereichaktionen']");

        string nodeValue;

        nodeValue = (docNode.InnerText);

        Debug.WriteLine("nodeValue");

//我怀疑上面有什么问题,但我不确定是什么问题。

        if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
        {

        }
        else
        {

            if (htmlDoc.DocumentNode != null)
            {
                HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body");

                if (bodyNode != null)
                {

                }
            }
        }
    }

有源地址,大家可以试试

谢谢大家 X.L

最佳答案

首先是第三方包Html Agility Pack通用应用程序不支持您当前使用的。请使用HtmlAgilityPack for .NET Core 1.4.9.2 通用应用程序支持。

其次,方法htmlDoc.LoadHtml(string html)的参数不是html站点的Uri,而是可以从webrequest的响应中得到的html内容。

所以正确的代码应该是这样的:

WebRequest request = HttpWebRequest.Create("http://www.eurogymnasium-waldenburg.de/egw_content/Stunden_Vertretungsplan/home.html");
WebResponse response = await request.GetResponseAsync();
Stream stream = response.GetResponseStream();
var result = "";
using (StreamReader sr = new StreamReader(stream))
{
    result = sr.ReadToEnd();
}
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(result);
var node = htmlDoc.DocumentNode.SelectSingleNode("/html/body[@class='ui-widget']/div[@id='main']/div[@id='vplan']/div[@id='bereichaktionen']");

我还上传了完整的项目CHtmlAgility到github你可以下载进行测试。

关于c# - HtmlAgility :no contents appeared (C#, UWP),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37896836/

相关文章:

c# - 如何将一个类传递给另一个类以进行代码隐藏?

javascript - 使用 Razor 将 C# List<int[]> 转换为 JavaScript

element.append 中的 JavaScript 变量值

c# - 单元测试应用程序(Windows 通用)中尚不存在 ExpectedException 属性?

c# - 提交简单表单 MVC ASP.Net 网站的堆栈溢出异常

c# - Union 或 Concat 中的类型不能用层次结构构造

html - 为什么 Facebook 共享无法获取我的 Firebase 存储镜像文件?

html - 如何使具有 2 行粘性的表头?! (没有js)

c# - Windows(手机)8.1 相机使用

c# - RestSharp.Portable - IgnoreResponseStatusCode 属性不适用于 UWP 应用程序?