c# - 使用 .net 从 html 页面解析(提取)内容

标签 c# javascript .net html-parsing

我需要从 html 页面解析/提取信息。 基本上我正在做的是使用 System.Net.WebClient 将页面作为字符串加载,并使用 HTML Agility Pack 获取 html 标签(表单、标签、输入等)内的内容。

但是,有些内容位于 javascript 脚本标记内,如下所示:

<script type="text/javascript">
//<![CDATA[
var itemCol = new Array();

itemCol[0] = {
    pid: "01010101",
    Desc: "Some desc",
    avail: "Available",
    price: "$10.00"
};

itemCol[1] = {
    pid: "01010101",
    Desc: "Some desc",
    avail: "Available",
    price: "$10.00"
};

//]]>
</script>

那么,我如何将其解析为 .NET 中的集合? HTML Agility Pack 可以帮助解决这个问题吗? 我真的很感谢任何帮助。

提前致谢。

最佳答案

HAP 不会为您解析出 javascript - 它最多只能解析出元素的内容。

javascript.net可能符合要求。

关于c# - 使用 .net 从 html 页面解析(提取)内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11197160/

相关文章:

javascript - SammyJS,判断是否是第一个请求

c# - 如何使用 LINQ 对序列中的相同值进行分组?

.net - Entity Framework 实体更新忽略时间戳

c# - SignalR 将数据服务器推送到客户端

javascript - 使用 JS 重新定位创建的 Div

c# - 切换内部循环影响性能?

javascript - 重新评估的匿名构造函数的原型(prototype)绑定(bind)可追溯至原始实例化对象

.net - 在文本框的 keyup 事件中按下回车键后消除回车键

c# - 在不触及注册表的情况下将页眉和页脚信息添加到 WebBrowser 的打印输出

c# - 异常后停止函数