我需要从 html 页面解析/提取信息。 基本上我正在做的是使用 System.Net.WebClient 将页面作为字符串加载,并使用 HTML Agility Pack 获取 html 标签(表单、标签、输入等)内的内容。
但是,有些内容位于 javascript 脚本标记内,如下所示:
<script type="text/javascript">
//<![CDATA[
var itemCol = new Array();
itemCol[0] = {
pid: "01010101",
Desc: "Some desc",
avail: "Available",
price: "$10.00"
};
itemCol[1] = {
pid: "01010101",
Desc: "Some desc",
avail: "Available",
price: "$10.00"
};
//]]>
</script>
那么,我如何将其解析为 .NET 中的集合? HTML Agility Pack 可以帮助解决这个问题吗? 我真的很感谢任何帮助。
提前致谢。
最佳答案
HAP 不会为您解析出 javascript - 它最多只能解析出元素的内容。
javascript.net可能符合要求。
关于c# - 使用 .net 从 html 页面解析(提取)内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11197160/