我已经设法用 C++(使用 winsock)制作了一个文件下载器。它会下载每个带有文件的简单链接,例如:www.page.com/image.png
我想让它从整个页面下载所有图像,例如从 4chan 线程下载所有图像,但我不知道我应该在 http 请求中发送什么来获取页面的源代码。如何请求网页的来源?
最佳答案
您没有按照您的想法在 http
请求中发送任何内容。
http
请求针对单个文档发送单个请求,并从服务器返回单个文档。
要下载整个页面,您必须解析下载的 HTML 文档,从 HTML 源中提取所有相关链接,然后为每个图像、css、js、等...从主文档中引用。
这就是像 wget's --recursive option 这样的工具下载整个页面。
关于c++ - 页面源的http请求是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38204676/