<分区>
我正在使用 C#,我想以编程方式下载一个完整的网页......我的意思不仅仅是页面源
我希望网页的下载方式与 FireFox 中的“页面另存为”相同,但我想以编程方式执行此操作?
<分区>
我正在使用 C#,我想以编程方式下载一个完整的网页......我的意思不仅仅是页面源
我希望网页的下载方式与 FireFox 中的“页面另存为”相同,但我想以编程方式执行此操作?
最佳答案
您需要下载并解析页面以找出所有外部资源,然后依次下载每个资源(并可能解析它并下载其中的资源)。
为了解析 HTML,我建议使用 HTML Agility Pack .您需要牢记要下载的资源(图像、CSS、JavaScript 等)并专门查询页面。
您需要记住,某些页面将定义 base
并且您需要考虑这一点以及具有相对和绝对链接的页面 URL。
您可能还想解析 CSS 以获取图像引用等内容。
最后,您需要将所有这些引用更改为指向资源下载位置的本地引用(感谢@Scott M)。
关于c# - 以编程方式下载 "COMPLETE"网页?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9637523/