c++ - 页面源的http请求是什么?

标签 c++ http winsock

我已经设法用 C++(使用 winsock)制作了一个文件下载器。它会下载每个带有文件的简单链接,例如:www.page.com/image.png

我想让它从整个页面下载所有图像,例如从 4chan 线程下载所有图像,但我不知道我应该在 http 请求中发送什么来获取页面的源代码。如何请求网页的来源?

最佳答案

您没有按照您的想法在 http 请求中发送任何内容。

http 请求针对单个文档发送单个请求,并从服务器返回单个文档。

要下载整个页面,您必须解析下载的 HTML 文档,从 HTML 源中提取所有相关链接,然后为每个图像、css、js、等...从主文档中引用。

这就是像 wget's --recursive option 这样的工具下载整个页面。

关于c++ - 页面源的http请求是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38204676/

相关文章:

c++ - 为什么在 __assume 中使用函数调用时 MSVC 不报错?

c++ - 如何使用访问器方法替换字符串中的特定字符

python - 刷新后显示相同页面的Http服务器?

html - POST 多个参数

c# - 如何在 C# 下向网络服务器发送执行 js 功能的请求?

c++ - 在 C++ 中通过 UDP 发送缓冲图像

c++ - 如何使用 winsock (c++) 发送\接收非字符数据?

c - 未使用 MinGW 编译的 Winsock 服务器代码

c++ - 使用 constexpr 或模板元编程简化较长的展开循环表达式

c++ - 我想在 C++ 中为 map<> 的给定 KEY 返回一个 VALUE。如果 KEY 不在 map<> 中,返回什么?