c# - 如何解析 Windows 应用商店应用程序中的 HTML?

标签 c# windows-store-apps

我下载了一个网页的源代码,我想解析 HTML 文本并将其转换为类似 HtmlDocument 对象或接口(interface)的东西,以便我可以访问其中的 HTML 元素。

我在网上做了一些搜索。似乎除了使用 HtmlAgilityPack 库之外,唯一可能的方法是创建一个 WebView 并调用其 NavigateToString() 方法。我不想使用第三方库,所以我尝试了第二种解决方案。我已经调用了该方法,但我不知道在哪里检索 Document 或类似的东西。

所以我的问题是:如何从 WebView 中检索 HtmlDocument?还是有更好的解决方案来做到这一点?

最佳答案

正如 Todd Bowles 在上面的评论中也指出的那样,如果存在第三方解决方案,使用它通常可以节省您宝贵的时间和精力。

HTML Agility Pack 的替代品,虽然仍处于相当早期的阶段,但它是 AngleSharp .它可以解析各种基于括号的超文本,特别是 HTML 和 CSS,并生成已解析超文本的 HTML5 DOM 表示。目前 HTML5 解析器声称已完成 95%,但希望这对正常使用的影响有限。

AngleSharp 是作为一个可移植类库 (PCL) 实现的,如果我没记错的话,它针对的是 Windows 应用商店应用。 NET Framework 4 及更高版本、Windows Phone 7 及更高版本,以及 Silverlight 4 及更高版本。

关于c# - 如何解析 Windows 应用商店应用程序中的 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20113956/

相关文章:

javascript - 使用边距的 CSS3 文本区域布局

c# - 如何在 Windows 8.1 中使用 SettingsFlyout 的完整高度和宽度

c# - 将货币文本解析为十进制类型时出现问题

c# - 如何将 WIX 安装项目与 WIX Bootstrapper 项目相结合

c# - 聚合根应该有依赖关系吗?

c# - 在 Windows 应用商店应用程序中加密和解密本地镜像

android - 如何查找和播放通过 Lynda.com Android 或 Windows 应用程序下载的视频

windows-8 - 在 Windows 8 C# 应用程序中导航回时再次调用页面构造函数

c# - 如何将简单的类成员重构为更复杂的类型?

c# - 创建新的调度程序